Interfejs Gemini API może generować tekstowe dane wyjściowe na podstawie różnych typów danych wejściowych, w tym tekstu, obrazów, filmów i dźwięku. Możesz używać generowania tekstu w różnych aplikacjach, w tym:
- Pisanie kreatywne
- Opisywanie i interpretowanie zasobów medialnych
- Uzupełnianie tekstu
- Podsumowywanie tekstu swobodnego
- Tłumaczenie między językami
- Twoje własne, nowatorskie zastosowania
Z tego przewodnika dowiesz się, jak wygenerować tekst za pomocą interfejsów API generateContent
i streamGenerateContent
oraz wybranego pakietu SDK po stronie serwera. Skupiamy się na tekście wyjściowym w postaci samej tekstu oraz danych wejściowych „tekst i obraz”. Więcej informacji o multimodalnych promptach z plikami wideo i audio znajdziesz w artykule Prompty za pomocą plików multimedialnych.
Co dalej
Z tego przewodnika dowiesz się, jak używać narzędzi generateContent
i streamGenerateContent
do generowania danych wyjściowych na podstawie danych wejściowych i tekstowych oraz obrazów. Więcej informacji o generowaniu tekstu za pomocą interfejsu Gemini API znajdziesz w tych materiałach:
- Wyświetlanie promptów przy użyciu plików multimedialnych: Gemini API obsługuje prompty zawierające dane tekstowe, graficzne, dźwiękowe i wideo.
- Instrukcje systemowe: instrukcje systemowe pozwalają sterować działaniem modelu w zależności od konkretnych potrzeb i przypadków użycia.
- Wskazówki dotyczące bezpieczeństwa: czasami modele generatywnej AI generują nieoczekiwane wyniki, na przykład wyniki, które są niedokładne, stronnicze lub obraźliwe. Przygotowanie do edycji oraz ocena manualna jest kluczowe dla ograniczenia ryzyku szkód wynikających z takich wyników.