Versión preliminar de Gemini 2.5 Flash Live

La API de Live permite interacciones de voz y video en tiempo real y de baja latencia con Gemini 2.5 Flash. Procesa flujos continuos de audio, video o texto para brindar respuestas habladas inmediatas y similares a las humanas, lo que crea una experiencia conversacional natural para tus usuarios.

Documentación

Visita la guía de la API en vivo para obtener una cobertura completa de las funciones y capacidades.

gemini-2.5-flash-native-audio-preview-12-2025

Propiedad Descripción
Código del modelo gemini-2.5-flash-native-audio-preview-12-2025
Tipos de datos admitidos

Entradas

Audio, video y texto

Resultado

Audio y texto

Límites de tokens[*]

Límite de tokens de entrada

131,072

Límite de tokens de salida

8,192

Funciones

Generación de audio

Admitido

API de Batch

No compatible

Almacenamiento en caché

No compatible

Ejecución de código

No compatible

Búsqueda de archivos

No compatible

Llamada a función

Admitido

Fundamentación con Google Maps

No compatible

Generación de imágenes

No compatible

API de Live

Admitido

Fundamentación de la búsqueda

Admitido

Resultados estructurados

No compatible

Pensamiento

Admitido

Contexto de la URL

No compatible

Versiones
Lee los patrones de versiones de modelos para obtener más detalles.
  • Vista previa: gemini-2.5-flash-native-audio-preview-12-2025
  • Vista previa: gemini-2.5-flash-native-audio-preview-09-2025
Última actualización Septiembre de 2025
Fecha límite de conocimiento Enero de 2025