Conversão de texto em voz do Gemini 2.5 Flash

Nosso mecanismo mais rápido para síntese de voz de alta fidelidade, oferecendo geração de áudio de baixa latência e econômica. O Gemini 2.5 Flash TTS é ideal para assistentes em tempo real, narração de alto volume e casos de uso de conversação que exigem controle refinado sobre o estilo e o ritmo da voz.

Documentação

Acesse o guia Text-to-Speech para conferir a cobertura completa de recursos e funcionalidades.

gemini-2.5-flash-preview-tts

Propriedade Descrição
Código do modelo gemini-2.5-flash-preview-tts
Tipos de dados aceitos

Entradas (link em inglês)

Texto

Saída

Áudio

Limites de tokens [*]

Limite de tokens de entrada

8.192

Limite de token de saída

16.384

Recursos

Geração de áudio

Compatível

Armazenamento em cache

incompatível

Execução de código

incompatível

Pesquisa de arquivos

Não aceito

Chamada de função

incompatível

Embasamento com o Google Maps

incompatível

Geração de imagens

incompatível

API Live

incompatível

Embasamento da pesquisa

incompatível

Respostas estruturadas

incompatível

Pensando

incompatível

Contexto do URL

incompatível

Opções de consumo

API em lote

Compatível

Inferência flexível

incompatível

Inferência de prioridade

incompatível

Versões
Leia os padrões de versão do modelo para mais detalhes.
  • gemini-2.5-flash-preview-tts
Última atualização Dezembro de 2025