Conversão de texto em voz do Gemini 2.5 Flash

Nosso mecanismo mais rápido para síntese de fala de alta fidelidade, oferecendo geração de áudio de baixa latência e custo-benefício. O Gemini 2.5 Flash TTS é ideal para assistentes em tempo real, narração de alto volume e casos de uso de conversação que exigem controle refinado sobre o estilo e o ritmo da voz.

Documentação

Acesse o guia Text-to-Speech para conferir a cobertura completa de recursos e funcionalidades.

gemini-2.5-flash-preview-tts

Propriedade Descrição
Código do modelo gemini-2.5-flash-preview-tts
Tipos de dados compatíveis

Entradas (link em inglês)

Texto

Saída

Áudio

Limites de token[*]

Limite de tokens de entrada

8.192

Limite de token de saída

16.384

Recursos

Geração de áudio

Compatível

API Batch

Compatível

Armazenamento em cache

incompatível

Execução de código

incompatível

Pesquisa de arquivos

Não compatível

Chamadas de função

incompatível

Embasamento com o Google Maps

incompatível

Geração de imagens

incompatível

API Live

incompatível

Pesquisar conteúdo de embasamento

incompatível

Respostas estruturadas

incompatível

Pensar

incompatível

Contexto do URL

incompatível

Versões do
Leia os padrões de versão do modelo para mais detalhes.
  • gemini-2.5-flash-preview-tts
Última atualização Dezembro de 2025