Versión preliminar de Gemini 3.1 Flash TTS (texto a voz)

El modelo Gemini 3.1 Flash TTS Preview proporciona una generación de voz potente y de baja latencia con salidas naturales, instrucciones controlables y nuevas etiquetas de audio expresivas para un control preciso de la narración.

Documentación

El modelo Gemini 3.1 Flash TTS Preview presenta etiquetas de audio expresivas para controlar la narración, así como mejoras generales en la naturalidad, la capacidad de control y la compatibilidad con varios idiomas.

Visita la guía de texto a voz para obtener una cobertura completa de las funciones y capacidades.

gemini-3.1-flash-tts-preview

Propiedad Descripción
Código del modelo gemini-3.1-flash-tts-preview
Tipos de datos admitidos

Entradas

Texto

Resultado

Audio

Límites de tokens[*]

Límite de tokens de entrada

8,192

Límite de tokens de salida

16,384

Funciones

Generación de audio

Admitido

API por lotes

Admitido

Almacenamiento en caché

No compatible

Ejecución de código

No compatible

Búsqueda de archivos

No compatible

Llamada a función

No compatible

Fundamentación con Google Maps

No compatible

Generación de imágenes

No compatible

API en vivo

No compatible

Fundamentación con la Búsqueda

No compatible

Salidas estructuradas

No compatible

Razonamiento

No compatible

Contexto de URL

No compatible

Versiones
Lee los patrones de versiones de modelos para obtener más detalles.
  • gemini-3.1-flash-tts-preview
Última actualización Abril de 2026
Corte de conocimiento Enero de 2025