Conversão de texto em voz do Gemini 2.5 Flash

Nosso mecanismo mais rápido para síntese de fala de alta fidelidade, que oferece geração de áudio de baixa latência e econômica. O Gemini 2.5 Flash TTS é ideal para assistentes em tempo real, narração de alto volume e casos de uso conversacionais que exigem controle refinado sobre o estilo e o ritmo da voz.

Documentação

Consulte o guia Text-to-Speech para conferir a cobertura completa de recursos e funcionalidades.

gemini-2.5-flash-preview-tts

Propriedade Descrição
Código do modelo gemini-2.5-flash-preview-tts
Tipos de dados com suporte

Entradas (link em inglês)

Texto

Saída

Áudio

Limites de token[*]

Limite de token de entrada

8.192

Limite de token de saída

16.384

Recursos

Geração de áudio

Compatível

API em lote

Compatível

Armazenamento em cache

indisponível

Execução de código

indisponível

Pesquisa de arquivos

incompatível

Chamadas de função

indisponível

Embasamento com o Google Maps

indisponível

Geração de imagens

indisponível

API Live

indisponível

Embasamento da pesquisa

indisponível

Respostas estruturadas

indisponível

Raciocínio

indisponível

Contexto de URL

indisponível

Versões
Leia os padrões de versão do modelo para mais detalhes.
  • gemini-2.5-flash-preview-tts
Atualização mais recente Dezembro de 2025