API Gemini может генерировать текстовый вывод из различных типов ввода, включая текст, изображения, видео и аудио. Вы можете использовать генерацию текста для различных приложений, в том числе:
- Творческое письмо
- Описание или интерпретация медиаактивов
- Завершение текста
- Обобщение текста в свободной форме
- Перевод между языками
- Чат-боты
- Ваши собственные новые варианты использования
В этом руководстве показано, как генерировать текст с помощью generateContent
streamGenerateContent
. Основное внимание уделяется выводу текста из ввода только текста и ввода текста и изображения. Дополнительные сведения о мультимодальных подсказках с помощью видео- и аудиофайлов см. в разделе Стратегии подсказок к файлам .
Что дальше
В этом руководстве показано, как generateContent
streamGenerateContent
для создания текстовых выходных данных из входных данных, состоящих только из текста или текста и изображения. Чтобы узнать больше о создании текста с помощью Gemini API, посетите следующие ресурсы:
- Стратегии запроса файлов . API Gemini поддерживает запросы с текстовыми, графическими, аудио- и видеоданными, также известные как мультимодальные запросы.
- Системные инструкции . Системные инструкции позволяют вам управлять поведением модели в зависимости от ваших конкретных потребностей и вариантов использования.
- Рекомендации по безопасности . Иногда генеративные модели искусственного интеллекта дают неожиданные результаты, например, неточные, предвзятые или оскорбительные. Постобработка и человеческая оценка необходимы для ограничения риска вреда от таких результатов.