Versión preliminar de Gemini 3.1 Flash TTS (texto a voz)

El modelo Gemini 3.1 Flash TTS Preview proporciona una potente generación de voz con baja latencia y resultados naturales, instrucciones controlables y nuevas etiquetas de audio expresivas para un control preciso de la narración.

Documentación

El modelo Gemini 3.1 Flash TTS Preview presenta etiquetas de audio expresivas para controlar la narración, así como mejoras generales en la naturalidad, la capacidad de control y la capacidad multilingüe.

Visita la guía de Text-to-Speech para obtener una cobertura completa de las funciones y capacidades.

gemini-3.1-flash-tts-preview

Propiedad Descripción
Código del modelo gemini-3.1-flash-tts-preview
Tipos de datos admitidos

Entradas

Texto

Resultado

Audio

Límites de tokens[*]

Límite de tokens de entrada

8,192

Límite de tokens de salida

16,384

Funciones

Generación de audio

Admitido

API de Batch

Admitido

Almacenamiento en caché

No compatible

Ejecución de código

No compatible

Búsqueda de archivos

No compatible

Llamada a función

No compatible

Fundamentación con Google Maps

No compatible

Generación de imágenes

No compatible

API de Live

No compatible

Fundamentación con la Búsqueda

No compatible

Resultados estructurados

No compatible

Pensamiento

No compatible

Contexto de la URL

No compatible

Versiones
Lee los patrones de versiones de modelos para obtener más detalles.
  • gemini-3.1-flash-tts-preview
Última actualización Abril de 2026
Fecha límite de conocimiento de Enero de 2025