A API Interactions já está disponível para todos os usuários. Recomendamos usar essa API para acessar todos os recursos e modelos mais recentes.

O Google usa tecnologia de IA na tradução de conteúdos para seu idioma de preferência. As traduções com IA podem ter erros.

Conversão de texto em voz do Gemini 2.5 Flash

Nosso mecanismo mais rápido para síntese de voz de alta fidelidade, oferecendo geração de áudio de baixa latência e econômica. O Gemini 2.5 Flash TTS é ideal para assistentes em tempo real, narração de alto volume e casos de uso de conversação que exigem controle refinado sobre o estilo e o ritmo da voz.

Testar no Google AI Studio

Documentação

Acesse o guia Text-to-Speech para conferir a cobertura completa de recursos e funcionalidades.

gemini-2.5-flash-preview-tts

Propriedade	Descrição
Código do modelo	`gemini-2.5-flash-preview-tts`
Tipos de dados aceitos	Entradas (link em inglês) Texto Saída Áudio
Limites de tokens ^[*]	Limite de tokens de entrada 8.192 Limite de token de saída 16.384
Recursos	Geração de áudio Compatível Armazenamento em cache incompatível Execução de código incompatível Pesquisa de arquivos Não aceito Chamada de função incompatível Embasamento com o Google Maps incompatível Geração de imagens incompatível API Live incompatível Embasamento da pesquisa incompatível Respostas estruturadas incompatível Pensando incompatível Contexto do URL incompatível
Opções de consumo	API em lote Compatível Inferência flexível incompatível Inferência de prioridade incompatível
Versões	Leia os padrões de versão do modelo para mais detalhes. `gemini-2.5-flash-preview-tts`
Última atualização	Dezembro de 2025