Faturamento

Este guia fornece uma visão geral das diferentes opções de faturamento da API Gemini, explica como ativar a cobrança e monitorar o uso, além de dar respostas a as perguntas mais frequentes sobre faturamento.

Sobre o faturamento

O faturamento da API Gemini é baseado em dois níveis de preços: sem custo financeiro (ou sem custo financeiro) e pagamento por uso (ou pago). Os preços e os limites de taxa são diferentes entre essas camadas e variam de acordo com o modelo. Para preços atuais e limites de taxas, consulte Preços. Para conferir um detalhamento dos recursos modelo a modelo, consulte Página de modelos do Gemini.

Limites de taxas

Os limites de taxa são cotas limitar o número de solicitações ou tokens que podem ser enviados à API Gemini em um em um determinado período. Os limites de taxa podem ser aplicados por solicitação ou por token. Confira exemplo fictício de cotas que podem se aplicar a um determinado modelo em um determinado nível:

  • 10 RPM (solicitações por minuto)
  • 10.000 TPM (tokens por minuto)
  • 1.000 RPD (solicitações por dia)

Nesse exemplo, se você exceder 10 RPM (ou 10.000 TPM ou 1.000 RPD), o O serviço da API Gemini gera um erro 429: RESOURCE_EXHAUSTED indicando de que o limite de taxa foi excedido.

Ao ativar o faturamento e usar o nível pago, você se beneficia de uma taxa maior limites, e seus comandos e respostas não são usados para melhorar os produtos do Google. Para mais informações sobre o uso de dados em serviços pagos, consulte a Termos de Serviço.

Cloud Billing

A API Gemini usa Faturamento do Cloud para serviços de faturamento. Para usar o nível pago, configure o Cloud Billing no seu projeto na nuvem. Depois de ativar o Cloud Billing, será possível usar o Cloud Ferramentas de faturamento para monitorar gastos, entender custos, fazer pagamentos e acessar Suporte do Cloud Billing.

Ativar faturamento

É possível ativar o Cloud Billing a partir do Google AI Studio:

  1. Abra o Google AI Studio.

  2. Na parte de baixo da barra lateral esquerda, selecione Configurações > Informações do plano.

  3. Clique em Configurar faturamento no projeto escolhido para ativar o Cloud Billing.

Monitorar o uso

Depois de ativar o Cloud Billing, é possível monitorar o uso da API Gemini no as Console do Google Cloud: O nome do serviço da API é generativelanguage.googleapis.com e, no console, a API Gemini também é chamada de API Generative Language.

console do Cloud

Para saber mais, consulte a documentação do Google Cloud sobre o uso da API Monitoring.

Perguntas frequentes

Esta seção fornece respostas para perguntas frequentes.

O que é cobrado?

Os preços da API Gemini se baseiam no seguinte:

  • Contagem de tokens de entrada
  • Contagem de tokens de saída
  • Contagem de tokens em cache
  • Duração do armazenamento de tokens em cache

Para mais informações sobre preços, consulte a página de preços.

Onde posso ver minha cota?

Confira sua cota e os limites do sistema no Console do Google Cloud:

Posso usar a API Gemini sem custo financeiro no EEE (incluindo a UE), no Reino Unido e na Suíça?

Há dois conjuntos de modelos disponíveis por meio da API:

  1. Modelos pagos que incluem Gemini 1.5 Flash, Gemini 1.5 Pro e Gemini 1.0 Profissional Esses modelos não terão um nível sem custo financeiro disponível no EEE (incluindo UE), Reino Unido e Suíça. Os desenvolvedores terão que passar pelas etapas necessárias para configurar uma conta de faturamento e pagar pelo uso.
  2. Alguns modelos podem ser acessados sem custo financeiro na API Gemini. Consulte Acesse ai.google.dev/pricing para ver detalhes sobre os modelos que são cobrados. os outros modelos são sem custo financeiro). No entanto, você ainda precisará configurar uma conta para usar esses modelos.

Se eu configurar o faturamento com a API Gemini, vou receber cobranças pelo uso do Google AI Studio?

Não, o uso do Google AI Studio vai continuar sem custo financeiro, independente da configuração faturamento em todas as regiões aceitas, incluindo EEE, UE, Reino Unido e Suíça.

Posso usar 1 milhão de tokens no nível sem custo financeiro?

O nível sem custo financeiro da API Gemini varia de acordo com o modelo selecionado. Por enquanto, pode testar a janela de contexto de 1 milhão de tokens das seguintes maneiras:

  • No Google AI Studio
  • Com planos de pagamento por uso
  • Com planos sem custo financeiro para modelos selecionados

Confira os limites mais recentes de taxas sem custo financeiro por modelo no página de preços.

Como posso calcular o número de tokens que estou usando?

Usar o GenerativeModel.count_tokens para contar o número de tokens. Consulte a Guia de tokens para saber mais sobre tokens.

Como é feito o faturamento?

O faturamento da API Gemini é processado pelo Sistema do Cloud Billing.

Serei cobrado por solicitações com falha?

Se sua solicitação falhar com um erro 400 ou 500, você não será cobrado pelo tokens usados. No entanto, a solicitação ainda será contabilizada na sua cota.

Há alguma cobrança para ajustar os modelos?

O ajuste de modelo é sem custo financeiro, mas a inferência em modelos ajustados é cobrado da mesma maneira que os modelos base.

O GetTokens é faturado?

As solicitações para a API GetTokens não são faturadas nem contabilizadas cota de inferência.

Onde posso receber ajuda sobre faturamento?

Para receber ajuda com faturamento, consulte Receba suporte para o Cloud Billing.