La API de Interactions ya está disponible de forma general. Te recomendamos que uses esta API para acceder a todos los modelos y funciones más recientes.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Versión preliminar de Gemini 3.1 Flash TTS (texto a voz)

El modelo de versión preliminar de Gemini 3.1 Flash TTS proporciona una potente generación de voz con baja latencia y resultados naturales, instrucciones controlables y nuevas etiquetas de audio expresivas para un control preciso de la narración.

Probar en Google AI Studio

Documentación

El modelo de versión preliminar de Gemini 3.1 Flash TTS introduce etiquetas de audio expresivas para controlar la narración, así como mejoras generales en la naturalidad, la capacidad de control y la capacidad multilingüe.

Visita la guía de Text-to-Speech para obtener una cobertura completa de las funciones y capacidades.

gemini-3.1-flash-tts-preview

Propiedad	Descripción
Código del modelo	`gemini-3.1-flash-tts-preview`
Tipos de datos admitidos	Entradas Texto Resultado Audio
Límites de tokens^[*]	Límite de tokens de entrada 8,192 Límite de tokens de salida 16,384
Funciones	Generación de audio Admitido Almacenamiento en caché No compatible Ejecución de código No compatible Búsqueda de archivos No compatible Llamada a función No compatible Fundamentación con Google Maps No compatible Generación de imágenes No compatible API de Live No compatible Fundamentación con la Búsqueda No compatible Resultados estructurados No compatible Pensamiento No compatible Contexto de la URL No compatible
Opciones de consumo	API de Batch Admitido Inferencia flexible No compatible Inferencia de prioridad No compatible
Versiones	Lee los patrones de versiones del modelo para obtener más detalles. `gemini-3.1-flash-tts-preview`
Última actualización	Abril de 2026
Fecha límite de conocimiento de	Enero de 2025