Interfejs Gemini API może generować tekstowe dane wyjściowe, gdy jako dane wejściowe podasz tekst, obrazy, filmy i dźwięk.
Z tego przewodnika dowiesz się, jak wygenerować tekst za pomocą metod generateContent
i streamGenerateContent
. Więcej informacji o możliwościach Gemini w zakresie przetwarzania obrazu i dźwięku znajdziesz w instrukcjach dotyczących obrazu i dźwięku.
Co dalej?
Teraz, gdy znasz już podstawy interfejsu Gemini API, możesz spróbować:
- Interpretacja obrazu: dowiedz się, jak używać natywnej interpretacji obrazu w Gemini do przetwarzania obrazów i filmów.
- Instrukcje systemowe: instrukcje systemowe pozwalają kierować działaniem modelu na podstawie konkretnych potrzeb i przypadków użycia.
- Rozumienie mowy: dowiedz się, jak używać natywnej funkcji Gemini do przetwarzania plików audio.