Limites de taxas

Os limites de taxa regulam o número de solicitações que você pode fazer para a API Gemini em um determinado período. Esses limites ajudam a manter o uso justo, proteger contra abusos e manter o desempenho do sistema para todos os usuários.

Como os limites de taxa funcionam

Os limites de taxa geralmente são medidos em três dimensões:

  • Solicitações por minuto (RPM)
  • Solicitações por dia (RPD)
  • Tokens por minuto (entrada) (TPM)

Seu uso é avaliado em relação a cada limite, e exceder qualquer um deles vai acionar um erro de limitação de taxa. Por exemplo, se o limite de RPM for 20, fazer 21 solicitações em um minuto vai resultar em um erro, mesmo que você não tenha excedido o TPM ou outros limites.

As limitações de taxa são aplicadas por projeto, não por chave de API.

Os limites variam de acordo com o modelo específico usado, e alguns limites se aplicam apenas a modelos específicos. Por exemplo, as imagens por minuto (IPM) só são calculadas para modelos capazes de gerar imagens (Imagen 3), mas são conceitualmente semelhantes aos TPM. Outros modelos podem ter um limite de tokens por dia (TPD).

Os limites de taxa são mais restritos para modelos experimentais e de prévia.

Níveis de uso

Os limites de taxa estão vinculados ao nível de uso do projeto. À medida que o uso e os gastos com a API aumentam, você tem a opção de fazer upgrade para um nível mais alto com limites de taxa maiores.

Nível Requisitos
Grátis Usuários em países qualificados
Nível 1 Conta de faturamento vinculada ao projeto
Nível 2 Gasto total: > US$ 250 e pelo menos 30 dias desde o pagamento bem-sucedido
Nível 3 Gasto total: > US$ 1.000 e pelo menos 30 dias desde o pagamento bem-sucedido

Quando você pede um upgrade, nosso sistema automatizado de proteção contra abusos realiza verificações adicionais. Embora atender aos critérios de qualificação declarados seja geralmente suficiente para aprovação, em casos raros, uma solicitação de upgrade pode ser negada com base em outros fatores identificados durante o processo de revisão.

Esse sistema ajuda a manter a segurança e a integridade da plataforma da API Gemini para todos os usuários.

Limitações de taxa de API padrão

A tabela a seguir lista os limites de taxa para todas as chamadas padrão da API Gemini.

Nível gratuito

Modelo RPM TPM RPD
Gemini 2.5 Pro 5 250.000 100
Gemini 2.5 Flash 10 250.000 250
Prévia do Gemini 2.5 Flash-Lite 17/06 15 250.000 1.000
Prévia da TTS do Gemini 2.5 Flash 3 10.000 15
Pré-lançamento da TTS do Gemini 2.5 Pro -- -- --
Gemini 2.0 Flash 15 1.000.000 200
Geração de imagens de pré-lançamento do Gemini 2.0 Flash 10 200.000 100
Gemini 2.0 Flash-Lite 30 1.000.000 200
Imagen 3 -- -- --
Veo 2 -- -- --
Gemini 1.5 Flash (descontinuado) 15 250.000 50
Gemini 1.5 Flash-8B (descontinuado) 15 250.000 50
Gemini 1.5 Pro (descontinuado) -- -- --
Gemma 3 e 3n 30 15.000 14.400
Gemini Embedding Experimental 03-07 5 -- 100

Nível 1

Modelo RPM TPM RPD
Gemini 2.5 Pro 150 2.000.000 1.000
Gemini 2.5 Flash 1.000 1.000.000 10.000
Prévia do Gemini 2.5 Flash-Lite 17/06 4.000 4.000.000 --
Prévia da TTS do Gemini 2.5 Flash 10 10.000 100
Pré-lançamento da TTS do Gemini 2.5 Pro 10 10.000 50
Gemini 2.0 Flash 2.000 4.000.000 --
Geração de imagens de pré-lançamento do Gemini 2.0 Flash 1.000 1.000.000 10.000
Gemini 2.0 Flash-Lite 4.000 4.000.000 --
Imagen 4 Standard 10 -- 70
Imagen 4 Ultra 5 -- 30
Imagen 3 20 -- --
Veo 2 2 vídeos por minuto -- 50 vídeos por dia
Gemini 1.5 Flash (descontinuado) 2.000 4.000.000 --
Gemini 1.5 Flash-8B (descontinuado) 4.000 4.000.000 --
Gemini 1.5 Pro (descontinuado) 1.000 4.000.000 --
Gemma 3 e 3n 30 15.000 14.400
Gemini Embedding Experimental 03-07 10 -- 1.000

Nível 2

Modelo RPM TPM RPD
Gemini 2.5 Pro 1.000 5.000.000 50.000
Gemini 2.5 Flash 2.000 3.000.000 100.000
Prévia do Gemini 2.5 Flash-Lite 17/06 10.000 10.000.000 100.000
Prévia da TTS do Gemini 2.5 Flash 1.000 100.000 10.000
Pré-lançamento da TTS do Gemini 2.5 Pro 100 25.000 1.000
Gemini 2.0 Flash 10.000 10.000.000 --
Geração de imagens de pré-lançamento do Gemini 2.0 Flash 2.000 3.000.000 100.000
Gemini 2.0 Flash-Lite 20.000 10.000.000 --
Imagen 4 Standard 10 -- 70
Imagen 4 Ultra 5 -- 30
Imagen 3 20 -- --
Veo 2 2 vídeos por minuto -- 50 vídeos por dia
Gemini 1.5 Flash (descontinuado) 2.000 4.000.000 --
Gemini 1.5 Flash-8B (descontinuado) 4.000 4.000.000 --
Gemini 1.5 Pro (descontinuado) 1.000 4.000.000 --
Gemma 3 e 3n 30 15.000 14.400
Gemini Embedding Experimental 03-07 10 -- 1.000

Nível 3

Modelo RPM TPM RPD
Gemini 2.5 Pro 2.000 8.000.000 --
Gemini 2.5 Flash 10.000 8.000.000 --
Prévia do Gemini 2.5 Flash-Lite 17/06 30.000 30.000.000 --
Prévia da TTS do Gemini 2.5 Flash 1.000 1.000.000 --
Pré-lançamento da TTS do Gemini 2.5 Pro 100 1.000.000 --
Gemini 2.0 Flash 30.000 30.000.000 --
Geração de imagens de pré-lançamento do Gemini 2.0 Flash 5.000 5.000.000 --
Gemini 2.0 Flash-Lite 30.000 30.000.000 --
Imagen 4 Standard 10 -- 70
Imagen 4 Ultra 5 -- 30
Imagen 3 20 -- --
Veo 2 2 vídeos por minuto -- 50 vídeos por dia
Gemini 1.5 Flash (descontinuado) 2.000 4.000.000 --
Gemini 1.5 Flash-8B (descontinuado) 4.000 4.000.000 --
Gemini 1.5 Pro (descontinuado) 1.000 4.000.000 --
Gemma 3 e 3n 30 15.000 14.400
Gemini Embedding Experimental 03-07 10 -- 1.000

Os limites de taxa especificados não são garantidos, e a capacidade real pode variar.

Limites de taxa da API Live

A API Live processa fluxos contínuos de áudio, vídeo ou texto para oferecer respostas faladas imediatas e semelhantes às humanas, criando uma experiência de conversa natural para seus usuários. Essa API tem um conjunto diferente de limites de taxa em comparação com as chamadas padrão da API Gemini.

Nível gratuito

Nome Sessões simultâneas TPM RPD
Gemini 2.5 Flash Live 3 1.000.000 --
Gemini 2.0 Flash Live 3 1.000.000 --
Caixa de diálogo de áudio nativo do pré-lançamento do Gemini 2.5 Flash 1 25.000 5
Diálogo de raciocínio de áudio nativo experimental do Gemini 2.5 Flash 1 10.000 5

Nível 1

Nome Sessões simultâneas TPM RPD
Gemini 2.5 Flash Live 50 4.000.000 --
Gemini 2.0 Flash Live 50 4.000.000 --
Caixa de diálogo de áudio nativo do pré-lançamento do Gemini 2.5 Flash 3 50.000 50
Diálogo de raciocínio de áudio nativo experimental do Gemini 2.5 Flash 1 25.000 50

Nível 2

Nome Sessões simultâneas TPM RPD
Gemini 2.5 Flash Live 1000 10.000.000 --
Gemini 2.0 Flash Live 1000 10.000.000 --
Caixa de diálogo de áudio nativo do pré-lançamento do Gemini 2.5 Flash 100 1.000.000 Ilimitado
Diálogo de raciocínio de áudio nativo experimental do Gemini 2.5 Flash -- -- --

Nível 3

Nome Sessões simultâneas TPM RPD
Gemini 2.5 Flash Live 1000 10.000.000 --
Gemini 2.0 Flash Live 1000 10.000.000 --
Caixa de diálogo de áudio nativo do pré-lançamento do Gemini 2.5 Flash -- -- --
Diálogo de raciocínio de áudio nativo experimental do Gemini 2.5 Flash -- -- --

Os limites de taxa especificados não são garantidos, e a capacidade real pode variar.

Limites de taxa do modo em lote

As solicitações do modo em lote estão sujeitas a limites de taxa próprios, separados das chamadas de API do modo não em lote.

  • Solicitações em lote simultâneas:100
  • Limite de tamanho do arquivo de entrada:2 GB
  • Limite de armazenamento de arquivos:20 GB
  • Tokens enfileirados por modelo:a tabela a seguir descreve o número máximo de tokens que podem ser enfileirados para processamento em lote em todos os jobs em lote ativos para um determinado modelo.

Nível 1

Modelo Limite de tokens enfileirados
Gemini 2.5 Pro 5.000.000
Gemini 2.5 Flash 3.000.000
Gemini 2.0 Flash 10.000.000
Gemini 2.0 Flash-Lite 10.000.000

Nível 2

Modelo Limite de tokens enfileirados
Gemini 2.5 Pro 500.000.000
Gemini 2.5 Flash 400.000.000
Gemini 2.0 Flash 1.000.000.000
Gemini 2.0 Flash-Lite 1.000.000.000

Nível 3

Modelo Limite de tokens enfileirados
Gemini 2.5 Pro 1.000.000.000
Gemini 2.5 Flash 1.000.000.000
Gemini 2.0 Flash 5.000.000.000
Gemini 2.0 Flash-Lite 5.000.000.000

Os limites de taxa especificados não são garantidos, e a capacidade real pode variar.

Como fazer upgrade para o próximo nível

A API Gemini usa o Cloud Billing para todos os serviços de faturamento. Para fazer a transição do nível sem custo financeiro para um nível pago, primeiro ative o faturamento do Cloud no seu projeto do Google Cloud.

Quando seu projeto atender aos critérios especificados, ele vai se qualificar para um upgrade para o próximo nível. Para pedir um upgrade, siga estas etapas:

Após uma validação rápida, o projeto será atualizado para o próximo nível.

Solicitar um aumento no limite de taxa

Cada variação de modelo tem um limite de taxa associado (solicitações por minuto, RPM). Para detalhes sobre esses limites de taxa, consulte Modelos do Gemini.

Solicitar um aumento no limite de taxa do nível pago

Não podemos garantir o aumento do seu limite de taxa, mas faremos o possível para analisar sua solicitação e entrar em contato com você se pudermos atender às suas necessidades de capacidade.