API Gemini может генерировать текстовый вывод, если в качестве входных данных предоставляются текст, изображения, видео и аудио.
В этом руководстве показано, как генерировать текст с помощью generateContent
streamGenerateContent
. Чтобы узнать о работе с видео- и аудиовозможностями Gemini, обратитесь к руководствам Vision и Audio .
Что дальше
Теперь, когда вы изучили основы API Gemini, вы можете попробовать:
- Понимание зрения : узнайте, как использовать встроенное понимание зрения Gemini для обработки изображений и видео.
- Распознавание звука : узнайте, как использовать встроенную функцию распознавания звука Gemini для обработки аудиофайлов.