Os limites de taxa regulam o número de solicitações que você pode fazer para a API Gemini em um determinado período. Esses limites ajudam a manter o uso justo, proteger contra abusos e manter a performance do sistema para todos os usuários.
Conferir os limites de taxa ativos no AI Studio
Como os limites de taxa funcionam
Os limites de taxa geralmente são medidos em três dimensões:
- Solicitações por minuto (RPM)
- Tokens por minuto (entrada) (TPM)
- Solicitações por dia (RPD)
Seu uso é avaliado em relação a cada limite, e exceder qualquer um deles vai acionar um erro de limite de taxa. Por exemplo, se o limite de RPM for 20, fazer 21 solicitações em um minuto vai resultar em um erro, mesmo que você não tenha excedido o TPM ou outros limites.
Os limites de taxa são aplicados por projeto, não por chave de API. As cotas de solicitações por dia (RPD) são redefinidas à meia-noite do horário do Pacífico.
Os limites variam dependendo do modelo específico usado, e alguns limites só se aplicam a modelos específicos. Por exemplo, as imagens por minuto (IPM) só são calculadas para modelos capazes de gerar imagens (Nano Banana), mas são conceitualmente semelhantes ao TPM. Outros modelos podem ter um limite de token por dia (TPD).
Os limites de taxa são mais restritos para modelos experimentais e de visualização.
Níveis de uso
Os limites de taxa estão vinculados ao nível de uso do projeto. À medida que o uso e os gastos da API aumentam, você recebe um upgrade automático para um nível mais alto com limites de taxa maiores.
As qualificações para os níveis 2 e 3 são baseadas no gasto cumulativo total nos serviços do Google Cloud (incluindo, entre outros, a API Gemini) para a conta de faturamento vinculada ao seu projeto.
| Nível de uso | Qualificação | Limite do nível de faturamento |
|---|---|---|
| Sem custo financeiro | Projeto ativo ou teste sem custo financeiro | N/A |
| Nível 1 | Configurar e vincular uma conta de faturamento ativa | US$ 250 |
| Nível 2 | US $100 pagos + 3 dias desde o primeiro pagamento bem-sucedido | US$ 2.000 |
| Nível 3 | US $1.000 pagos + 30 dias desde o primeiro pagamento bem-sucedido | US$ 20.000 a US$ 100.000 ou mais |
Embora atender aos critérios de qualificação declarados seja geralmente suficiente para aprovação, em casos raros, uma solicitação de upgrade pode ser negada com base em outros fatores identificados durante o processo de análise.
Esse sistema ajuda a manter a segurança e a integridade da plataforma da API Gemini para todos os usuários.
Limites de taxa da API Gemini
Os limites de taxa dependem de vários fatores (como o nível de uso) e podem ser visualizados no Google AI Studio. À medida que o nível e o status da conta mudam ao longo do tempo, os limites de taxa são atualizados automaticamente.
Conferir os limites de taxa ativos no AI Studio
Os limites de taxa especificados não são garantidos, e a capacidade real pode variar.
Limites de taxa da API em lote
As solicitações de API em lote estão sujeitas aos próprios limites de taxa, separados das chamadas de API não em lote.
- Solicitações em lote simultâneas:100
- Limite de tamanho do arquivo de entrada:2 GB
- Limite de armazenamento de arquivos:20 GB
- Tokens enfileirados por modelo:a tabela Tokens enfileirados em lote lista o número máximo de tokens que podem ser enfileirados para processamento em lote em todos os jobs em lote ativos para um determinado modelo.
Nível 1
| Modelo | Tokens enfileirados em lote | |||
|---|---|---|---|---|
| Modelos de saída de texto | ||||
| Visualização do Gemini 3.1 Pro | 5.000.000 | |||
| Visualização do Gemini 3.1 Flash-Lite | 10.000.000 | |||
| Visualização do Gemini 3 Flash | 3.000.000 | |||
| Gemini 2.5 Pro | 5.000.000 | |||
| Gemini 2.5 Pro TTS | 25.000 | |||
| Gemini 2.5 Flash | 3.000.000 | |||
| Visualização do Gemini 2.5 Flash | 3.000.000 | |||
| Visualização de imagem do Gemini 2.5 Flash | 3.000.000 | |||
| Gemini 2.5 Flash TTS | 100.000 | |||
| Gemini 2.5 Flash-Lite | 10.000.000 | |||
| Visualização do Gemini 2.5 Flash-Lite | 10.000.000 | |||
| Gemini 2.0 Flash | 10.000.000 | |||
| Imagem do Gemini 2.0 Flash | 3.000.000 | |||
| Gemini 2.0 Flash-Lite | 10.000.000 | |||
| Modelos de geração multimodal | ||||
| Visualização de imagem do Gemini 3.1 Flash 🍌 | 1.000.000 | |||
| Visualização de imagem do Gemini 3 Pro 🍌 | 2.000.000 | |||
| Como incorporar modelos | ||||
| Incorporação do Gemini | 500.000 | |||
Nível 2
| Modelo | Tokens enfileirados em lote | |||
|---|---|---|---|---|
| Modelos de saída de texto | ||||
| Visualização do Gemini 3.1 Pro | 500.000.000 | |||
| Visualização do Gemini 3.1 Flash-Lite | 500.000.000 | |||
| Visualização do Gemini 3.1 Flash | 400.000.000 | |||
| Gemini 2.5 Pro | 500.000.000 | |||
| Gemini 2.5 Pro TTS | 100.000 | |||
| Gemini 2.5 Flash | 400.000.000 | |||
| Visualização do Gemini 2.5 Flash | 400.000.000 | |||
| Visualização de imagem do Gemini 2.5 Flash | 400.000.000 | |||
| Gemini 2.5 Flash TTS | 100.000 | |||
| Gemini 2.5 Flash-Lite | 500.000.000 | |||
| Visualização do Gemini 2.5 Flash-Lite | 500.000.000 | |||
| Gemini 2.0 Flash | 1.000.000.000 | |||
| Imagem do Gemini 2.0 Flash | 400.000.000 | |||
| Gemini 2.0 Flash-Lite | 1.000.000.000 | |||
| Modelos de geração multimodal | ||||
| Visualização de imagem do Gemini 3.1 Flash 🍌 | 250.000.000 | |||
| Visualização de imagem do Gemini 3 Pro 🍌 | 270.000.000 | |||
| Como incorporar modelos | ||||
| Incorporação do Gemini | 5.000.000 | |||
Nível 3
| Modelo | Tokens enfileirados em lote | |||
|---|---|---|---|---|
| Modelos de saída de texto | ||||
| Visualização do Gemini 3.1 Pro | 1.000.000.000 | |||
| Visualização do Gemini 3.1 Flash-Lite | 1.000.000.000 | |||
| Visualização do Gemini 3.1 Flash | 1.000.000.000 | |||
| Gemini 2.5 Pro | 1.000.000.000 | |||
| Gemini 2.5 Pro TTS | 1.000.000 | |||
| Gemini 2.5 Flash | 1.000.000.000 | |||
| Visualização do Gemini 2.5 Flash | 1.000.000.000 | |||
| Visualização de imagem do Gemini 2.5 Flash | 1.000.000.000 | |||
| Gemini 2.5 Flash TTS | 4.000.000 | |||
| Gemini 2.5 Flash-Lite | 1.000.000.000 | |||
| Visualização do Gemini 2.5 Flash-Lite | 1.000.000.000 | |||
| Gemini 2.0 Flash | 5.000.000.000 | |||
| Imagem do Gemini 2.0 Flash | 1.000.000.000 | |||
| Gemini 2.0 Flash-Lite | 5.000.000.000 | |||
| Modelos de geração multimodal | ||||
| Visualização de imagem do Gemini 3.1 Flash 🍌 | 750.000.000 | |||
| Visualização de imagem do Gemini 3 Pro 🍌 | 1.000.000.000 | |||
| Como incorporar modelos | ||||
| Incorporação do Gemini | 10.000.000 | |||
Como fazer upgrade para o próximo nível
Para fazer a transição do nível sem custo financeiro para um nível pago, primeiro configure o faturamento no AI Studio.
Quando o projeto atender aos critérios especificados, ele vai receber um upgrade automático para o próximo nível. Os upgrades de nível do sem custo financeiro para o nível 1 geralmente entram em vigor instantaneamente, e os upgrades de nível subsequentes entram em vigor em até 10 minutos. Acesse a página Projetos no AI Studio para conferir seus níveis.
Solicitar um aumento no limite de taxa
Cada variação de modelo tem um limite de taxa associado (solicitações por minuto, RPM). Para mais detalhes sobre esses limites de taxa, consulte a página Limite de taxa do AI Studio.
Solicitar aumento do limite de taxa do nível pago
Não oferecemos garantias sobre o aumento do limite de taxa, mas faremos o possível para analisar sua solicitação.