Esta página foi traduzida pela API Cloud Translation.

Modelos de preços

Preço para ajudar você a lançar seu app no mundo

Gemini 1.5 Flash Já disponível

Nosso modelo multimodal mais rápido, com ótimo desempenho para tarefas diversas e repetitivas e uma janela de contexto de 1 milhão. Agora está disponível para uso geral.

Sem custo financeiro

O "nível gratuito" da API Gemini é oferecido pelo serviço da API com limites de taxa mais baixos para fins de teste. O uso do Google AI Studio é totalmente gratuito em todos os países disponíveis.

Limites de taxas

15 RPM (solicitações por minuto)

1 milhão de TPM (tokens por minuto)

1.500 RPD (solicitações por dia)

Inserir preços

Sem custo financeiro

Preços de saída

Sem custo financeiro

O armazenamento em cache de contexto

Sem custo financeiro, até 1 milhão de tokens de armazenamento por hora

Preço de ajuste

Os preços de entrada/saída são os mesmos para modelos ajustados. O serviço de ajuste é sem custo financeiro.

Embasamento com a Pesquisa Google

Indisponível

Usado para melhorar nossos produtos

Sim

Pagamento por uso (preços em USD)

Amplie seu serviço de IA com confiança usando o serviço de faturamento de pagamento por uso da API Gemini. Configure o faturamento facilmente no Google AI Studio clicando em "Receber chave de API".

Limites de taxas

2.000 RPM (solicitações por minuto)

4 milhões de TPM (tokens por minuto)

Solicita até 128 mil tokens

Inserir preços

US$ 0,075 / 1 milhão de tokens

Preços de saída

US$ 0,30 / 1 milhão de tokens

Armazenamento em cache de contexto

US$ 0,01875 / 1 milhão de tokens

Comandos com mais de 128 mil

Inserir preços

US$ 0,15 / 1 milhão de tokens

Preços de saída

US$ 0,60 / 1 milhão de tokens

Armazenamento em cache de contexto

US$ 0,0375 / 1 milhão de tokens

Armazenamento em cache de contexto

US$ 1,00 / 1 milhão de tokens por hora

Saiba mais

Preço de ajuste

Os preços de entrada/saída são os mesmos para modelos ajustados. O serviço de ajuste é sem custo financeiro.

Embasamento com a Pesquisa Google

US$ 35 / 1.000 solicitações de desativação (até 5.000 solicitações por dia).

Usado para melhorar nossos produtos

Não

Teste a Vertex AI no Google Cloud

Voltar ao início

* O uso do Google AI Studio é sem custo financeiro em todas as regiões disponíveis. Consulte as Perguntas frequentes sobre faturamento para mais detalhes.
** Os limites de taxa especificados não são garantidos, e a capacidade real pode variar.
*** Os preços podem ser diferentes dos listados aqui e dos oferecidos na Vertex AI. Para saber os preços da Vertex, consulte a documentação da Vertex.
**** Se você estiver usando a remoção dinâmica para otimizar os custos, apenas as solicitações que contêm pelo menos um URL de suporte de fundamentação da Web na resposta serão cobradas pela fundamentação com a Pesquisa Google. Os custos do Gemini sempre se aplicam. Os limites de taxa estão sujeitos a alterações. Confira os termos atualizados.

Gemini 1.5 Flash-8B Já disponível

Nosso modelo menor para casos de uso de inteligência mais simples com uma janela de contexto de 1 milhão de tokens. Agora está disponível para uso geral.

Sem custo financeiro

Limites de taxas

15 RPM (solicitações por minuto)

1 milhão de TPM (tokens por minuto)

1.500 RPD (solicitações por dia)

Inserir preços

Sem custo financeiro

Preços de saída

Sem custo financeiro

O armazenamento em cache de contexto

Sem custo financeiro, até 1 milhão de tokens de armazenamento por hora

Preço de ajuste

Os preços de entrada/saída são os mesmos para modelos ajustados. O serviço de ajuste é sem custo financeiro.

Embasamento com a Pesquisa Google

Indisponível

Usado para melhorar nossos produtos

Sim

Pagamento por uso (preços em USD)

Limites de taxas

4.000 RPM (solicitações por minuto)

4 milhões de TPM (tokens por minuto)

Solicita até 128 mil tokens

Inserir preços

US$ 0,0375 / 1 milhão de tokens

Preços de saída

US$ 0,15 / 1 milhão de tokens

Armazenamento em cache de contexto

US$ 0,01 / 1 milhão de tokens

Comandos com mais de 128 mil

Inserir preços

US$ 0,075 / 1 milhão de tokens

Preços de saída

US$ 0,30 / 1 milhão de tokens

Armazenamento em cache de contexto

US$ 0,02 / 1 milhão de tokens

Armazenamento em cache de contexto

US$ 0,25 / 1 milhão de tokens por hora

Saiba mais

Preço de ajuste

Os preços de entrada/saída são os mesmos para modelos ajustados. O serviço de ajuste é sem custo financeiro.

Embasamento com a Pesquisa Google

US$ 35 / 1.000 solicitações de desativação (até 5.000 solicitações por dia).

Usado para melhorar nossos produtos

Não

Teste a Vertex AI no Google Cloud

Voltar ao início

* O uso do Google AI Studio é sem custo financeiro em todas as regiões disponíveis. Consulte as Perguntas frequentes sobre faturamento para mais detalhes.
** Os limites de taxa especificados não são garantidos, e a capacidade real pode variar.
*** Os preços podem ser diferentes dos listados aqui e dos oferecidos na Vertex AI. Para saber os preços da Vertex, consulte a documentação da Vertex.
**** Se você estiver usando a remoção dinâmica para otimizar os custos, apenas as solicitações que contêm pelo menos um URL de suporte de fundamentação da Web na resposta serão cobradas pela fundamentação com a Pesquisa Google. Os custos do Gemini sempre se aplicam. Os limites de taxa estão sujeitos a alterações. Confira os termos atualizados.

Gemini 1.5 Pro Já disponível

Nosso modelo de última geração com uma janela de contexto inovadora de 2 milhões. Agora está disponível para uso geral.

Sem custo financeiro

Limites de taxas

2 RPM (solicitações por minuto)

32.000 TPM (tokens por minuto)

50 RPD (solicitações por dia)

Inserir preços

Sem custo financeiro

Preços de saída

Sem custo financeiro

O armazenamento em cache de contexto

Não relevante

Preço de ajuste

Indisponível

Embasamento com a Pesquisa Google

Indisponível

Usado para melhorar nossos produtos

Sim

Pagamento por uso (preços em USD)

Limites de taxas

1.000 RPM (solicitações por minuto)

4 milhões de TPM (tokens por minuto)

Solicita até 128 mil tokens

Inserir preços

US$ 1,25 por 1 milhão de tokens

Preços de saída

US$ 5,00 / 1 milhão de tokens

Armazenamento em cache de contexto

US$ 0,3125 / 1 milhão de tokens

Comandos com mais de 128 mil

Inserir preços

US$ 2,50 / 1 milhão de tokens

Preços de saída

US$ 10,00 / 1 milhão de tokens

Armazenamento em cache de contexto

US$ 0,625 / 1 milhão de tokens

Armazenamento em cache de contexto

US$ 4,50 / 1 milhão de tokens por hora

Saiba mais

Preço de ajuste

Indisponível

Embasamento com a Pesquisa Google

US$ 35 / 1.000 solicitações de desativação (até 5.000 solicitações por dia).

Usado para melhorar nossos produtos

Não

Teste a Vertex AI no Google Cloud

Voltar ao início

* O uso do Google AI Studio é sem custo financeiro em todas as regiões disponíveis. Consulte as Perguntas frequentes sobre faturamento para mais detalhes.
** Os limites de taxa especificados não são garantidos, e a capacidade real pode variar.
*** Os preços podem ser diferentes dos listados aqui e dos oferecidos na Vertex AI. Para saber os preços da Vertex, consulte a documentação da Vertex.
**** Se você estiver usando a remoção dinâmica para otimizar os custos, apenas as solicitações que contêm pelo menos um URL de suporte de fundamentação da Web na resposta serão cobradas pela fundamentação com a Pesquisa Google. Os custos do Gemini sempre se aplicam. Os limites de taxa estão sujeitos a alterações. Confira os termos atualizados.

Gemini 1.0 Pro Disponível agora

Nosso modelo de primeira geração oferece apenas raciocínio de texto e imagem. Geralmente disponível para uso em produção.

Sem custo financeiro

Limites de taxas

15 RPM (solicitações por minuto)

32.000 TPM (tokens por minuto)

1.500 RPD (solicitações por dia)

Inserir preços

Sem custo financeiro

Preços de saída

Sem custo financeiro

O armazenamento em cache de contexto

Não relevante

Preço de ajuste

Indisponível

Embasamento com a Pesquisa Google

Indisponível

Usado para melhorar nossos produtos

Sim

Pagamento por uso (preços em USD)

Limites de taxas

360 RPM (solicitações por minuto)

120.000 TPM (tokens por minuto)

30.000 RPD (solicitações por dia)

Inserir preços

US$ 0,50 / 1 milhão de tokens

Preços de saída

US$ 1,50 / 1 milhão de tokens

O armazenamento em cache de contexto

Indisponível

Preço de ajuste

Indisponível

Embasamento com a Pesquisa Google

Indisponível

Usado para melhorar nossos produtos

Não

Teste a Vertex AI no Google Cloud

Voltar ao início

* O uso do Google AI Studio é sem custo financeiro em todas as regiões disponíveis. Consulte as Perguntas frequentes sobre faturamento para mais detalhes.
** Os limites de taxa especificados não são garantidos, e a capacidade real pode variar. Solicite um aumento no limite máximo de taxa (somente para o nível pago).
*** Os preços podem ser diferentes dos listados aqui e dos oferecidos na Vertex AI. Para saber os preços da Vertex, consulte a documentação da Vertex.
**** Se você estiver usando a remoção dinâmica para otimizar os custos, apenas as solicitações que contêm pelo menos um URL de suporte de fundamentação da Web na resposta serão cobradas pela fundamentação com a Pesquisa Google. Os custos do Gemini sempre se aplicam. Os limites de taxa estão sujeitos a alterações. Confira os termos atualizados.

Embedding de texto 004 Disponível agora

Nosso modelo de embedding de texto de última geração.

Sem custo financeiro

Limites de taxas

1.500 RPM (solicitações por minuto)

Inserir preços

Sem custo financeiro

Preços de saída

Sem custo financeiro

O armazenamento em cache de contexto

Não relevante

Preço de ajuste

Não relevante

Usado para melhorar nossos produtos

Sim

Teste a Vertex AI no Google Cloud

Voltar ao início

* O uso do Google AI Studio é sem custo financeiro em todas as regiões disponíveis. Consulte as Perguntas frequentes sobre faturamento para mais detalhes.
** Os limites de taxa especificados não são garantidos, e a capacidade real pode variar. Solicite um aumento no limite máximo de taxa (somente para o nível pago).
*** Os preços podem ser diferentes dos listados aqui e dos oferecidos na Vertex AI. Para saber os preços da Vertex, consulte a documentação da Vertex.