La API de Interactions ya está disponible de forma general. Te recomendamos que uses esta API para acceder a todos los modelos y funciones más recientes.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini 2.5 Flash Text-to-Speech

Es nuestro motor más rápido para la síntesis de voz de alta fidelidad, que ofrece baja latencia y generación de audio rentable. Gemini 2.5 Flash TTS es ideal para asistentes en tiempo real, narraciones de gran volumen y casos de uso conversacionales que requieren un control detallado sobre el estilo y el ritmo de la voz.

Probar en Google AI Studio

Documentación

Visita la guía de Text-to-Speech para obtener una cobertura completa de las funciones y capacidades.

gemini-2.5-flash-preview-tts

Propiedad	Descripción
Código del modelo	`gemini-2.5-flash-preview-tts`
Tipos de datos admitidos	Entradas Texto Resultado Audio
Límites de tokens^[*]	Límite de tokens de entrada 8,192 Límite de tokens de salida 16,384
Funciones	Generación de audio Admitido Almacenamiento en caché No compatible Ejecución de código No compatible Búsqueda de archivos No compatible Llamada a función No compatible Fundamentación con Google Maps No compatible Generación de imágenes No compatible API de Live No compatible Fundamentación con la Búsqueda No compatible Resultados estructurados No compatible Pensamiento No compatible Contexto de la URL No compatible
Opciones de consumo	API de Batch Admitido Inferencia flexible No compatible Inferencia de prioridad No compatible
Versiones	Lee los patrones de versiones del modelo para obtener más detalles. `gemini-2.5-flash-preview-tts`
Última actualización	Diciembre de 2025