La API de Gemini puede generar un resultado de texto cuando se proporcionan texto, imágenes, video y audio como entrada.
En esta guía, se muestra cómo generar texto con los métodos generateContent
y streamGenerateContent
. Para obtener información sobre cómo trabajar con las capacidades de visión y audio de Gemini, consulta las guías de visión y audio.
¿Qué sigue?
Ahora que exploraste los conceptos básicos de la API de Gemini, te recomendamos que pruebes lo siguiente:
- Comprensión visual: Aprende a usar la comprensión visual nativa de Gemini para procesar imágenes y videos.
- Instrucciones del sistema: Las instrucciones del sistema te permiten dirigir el comportamiento del modelo según tus necesidades y casos de uso específicos.
- Comprensión de audio: Aprende a usar la comprensión de audio nativa de Gemini para procesar archivos de audio.