API Gemini может генерировать текстовый вывод, если в качестве входных данных предоставляются текст, изображения, видео и аудио.
В этом руководстве показано, как генерировать текст с помощью generateContent
streamGenerateContent
. Чтобы узнать о работе с видео- и аудиовозможностями Gemini, обратитесь к руководствам Vision и Audio .
Что дальше
Теперь, когда вы изучили основы API Gemini, вы можете попробовать:
- Понимание зрения : узнайте, как использовать встроенное понимание зрения Gemini для обработки изображений и видео.
- Системные инструкции . Системные инструкции позволяют вам управлять поведением модели в зависимости от ваших конкретных потребностей и вариантов использования.
- Распознавание звука . Узнайте, как использовать встроенную функцию распознавания звука Gemini для обработки аудиофайлов.