La API de Gemini puede generar un resultado de texto cuando se proporcionan texto, imágenes, video y audio como entrada.
En esta guía, se muestra cómo generar texto con los métodos generateContent
y streamGenerateContent
. Para obtener información sobre cómo trabajar con las capacidades de visión y audio de Gemini, consulta las guías de visión y audio.
¿Qué sigue?
Ahora que exploraste los conceptos básicos de la API de Gemini, te recomendamos que pruebes lo siguiente:
- Comprensión visual: Aprende a usar la comprensión visual nativa de Gemini para procesar imágenes y videos.
- Comprensión de audio: Obtén información para usar la comprensión de audio nativa de Gemini y procesar archivos de audio.