La API de Gemini puede generar un resultado de texto cuando se proporcionan texto, imágenes, video y audio como entrada.
En esta guía, se muestra cómo generar texto con los métodos generateContent
y streamGenerateContent
. Si quieres obtener información para trabajar con las capacidades de visión y audio de Gemini, consulta las guías de Vision y audio.
¿Qué sigue?
Ahora que exploraste los conceptos básicos de la API de Gemini, te recomendamos que pruebes lo siguiente:
- Comprensión visual: Aprende a usar la comprensión visual nativa de Gemini para procesar imágenes y videos.
- Instrucciones del sistema: Las instrucciones del sistema te permiten controlar el comportamiento del modelo según tus necesidades específicas y casos de uso.
- Comprensión de audio: Aprende a usar la comprensión de audio nativa de Gemini para procesar archivos de audio.