Gemini 2.5 Flash Text-to-Speech

Es nuestro motor más rápido para la síntesis de voz de alta fidelidad, que ofrece baja latencia y generación de audio rentable. Gemini 2.5 Flash TTS es ideal para asistentes en tiempo real, narración de gran volumen y casos de uso conversacionales que requieren un control detallado sobre el estilo y el ritmo de la voz.

Documentación

Visita la guía de Text-to-Speech para obtener una cobertura completa de las funciones y capacidades.

gemini-2.5-flash-preview-tts

Propiedad Descripción
Código del modelo gemini-2.5-flash-preview-tts
Tipos de datos admitidos

Entradas

Texto

Resultado

Audio

Límites de tokens[*]

Límite de tokens de entrada

8,192

Límite de tokens de salida

16,384

Funciones

Generación de audio

Admitido

API de Batch

Admitido

Almacenamiento en caché

No compatible

Ejecución de código

No compatible

Búsqueda de archivos

No compatible

Llamada a función

No compatible

Fundamentación con Google Maps

No compatible

Generación de imágenes

No compatible

API de Live

No compatible

Fundamentación de la búsqueda

No compatible

Resultados estructurados

No compatible

Pensamiento

No compatible

Contexto de la URL

No compatible

Versiones
Lee los patrones de versiones de modelos para obtener más detalles.
  • gemini-2.5-flash-preview-tts
Última actualización Diciembre de 2025