Preço para ajudar você a levar seu app para o mundo
Disponíveis agora
Disponíveis agora
Disponíveis agora
Nosso modelo multimodal mais rápido com ótimo desempenho para tarefas diversas e repetitivas e uma janela de contexto de 1 milhão. Agora em disponibilidade geral para uso na produção.
Sem custo financeiro*
Limites de taxa**
15 RPM (solicitações por minuto)
1 milhão de TPM (tokens por minuto)
1.500 RPD (solicitações por dia)
Preço (entrada)
Sem custo financeiro
Armazenamento em cache de contexto
Não relevante
Preço (saída)
Sem custo financeiro
Comandos/respostas usados para melhorar nossos produtos
Sim
Pagamento por uso (preços em USD)***
Limites de taxa**
1.000 RPM (solicitações por minuto)
4 milhões de TPM (tokens por minuto)
Preço (entrada)
US$ 0,35 / 1 milhão de tokens (para prompts de até 128 mil tokens)
US$ 0,70 / 1 milhão de tokens (para solicitações maiores que 128 mil)
Armazenamento em cache de contexto
US$ 0,0875 / 1 milhão de tokens (para prompts de até 128 mil tokens)
US$ 0,175 / 1 milhão de tokens (para prompts maiores que 128 mil)
US$ 1,00 / 1 milhão de tokens por hora (armazenamento)
Preço (saída)
US$ 1,05 / 1 milhão de tokens (para prompts de até 128 mil tokens)
US$ 2,10 / 1 milhão de tokens (para solicitações maiores que 128 mil)
Comandos/respostas usados para melhorar nossos produtos
Não
Nosso modelo de última geração com uma janela de contexto inovadora de 2 milhões. Agora em disponibilidade geral para uso na produção.
Sem custo financeiro*
Limites de taxa**
2 RPM (solicitações por minuto)
32.000 TPM (tokens por minuto)
50 RPD (solicitações por dia)
Preço (entrada)
Sem custo financeiro
Armazenamento em cache de contexto
Não relevante
Preço (saída)
Sem custo financeiro
Comandos/respostas usados para melhorar nossos produtos
Sim
Pagamento por uso (preços em USD)***
Limites de taxa**
360 RPM (solicitações por minuto)
4 milhões de TPM (tokens por minuto)
10.000 RPD (solicitações por dia)
Preço (entrada)
US$ 3,50 / 1 milhão de tokens (para prompts de até 128 mil tokens)
US$ 7,00 / 1 milhão de tokens (para solicitações maiores que 128 mil)
Armazenamento em cache de contexto
US$ 0,875 / 1 milhão de tokens (para prompts de até 128 mil tokens)
US$ 1,75 / 1 milhão de tokens (para solicitações maiores que 128 mil)
US$ 4,50 / 1 milhão de tokens por hora (armazenamento)
Preço (saída)
US$ 10,50 / 1 milhão de tokens (para prompts de até 128 mil tokens)
US$ 21,00 / 1 milhão de tokens (para prompts maiores que 128 mil)
Comandos/respostas usados para melhorar nossos produtos
Não
Nosso modelo de primeira geração oferece somente raciocínio de texto e imagem. Disponibilidade geral para uso na produção.
Sem custo financeiro*
Limites de taxa**
15 RPM (solicitações por minuto)
32.000 TPM (tokens por minuto)
1.500 RPD (solicitações por dia)
Preço (entrada)
Sem custo financeiro
Armazenamento em cache de contexto
Não relevante
Preço (saída)
Sem custo financeiro
Comandos/respostas usados para melhorar nossos produtos
Sim
Pagamento por uso (preços em USD)***
Limites de taxa**
360 RPM (solicitações por minuto)
120.000 TPM (tokens por minuto)
30.000 RPD (solicitações por dia)
Preço (entrada)
US$ 0,50 / 1 milhão de tokens
Armazenamento em cache de contexto
Indisponível
Preço (saída)
US$ 1,50 / 1 milhão de tokens
Comandos/respostas usados para melhorar nossos produtos
Não
*As restrições de uso do nível sem custo financeiro da API Gemini se aplicam ao EEE (incluindo a UE), ao Reino Unido e à Suíça. Consulte as perguntas frequentes sobre faturamento para mais detalhes.
**Os limites de taxa especificados não são garantidos, e a capacidade real pode variar. Inscreva-se para aumentar o limite máximo de taxa (somente para o nível pago).
***Os custos de inferência de modelos ajustados são cobrados com o mesmo preço dos modelos base. Para receber ajuda com faturamento, consulte Suporte do Cloud Billing.
****Os preços podem ser diferentes dos listados aqui e dos oferecidos na Vertex AI. Para preços da Vertex, consulte a documentação da Vertex.
Crie com a Vertex AI no Google Cloud