Preço para ajudar você a levar seu app para o mundo
Disponível agora
Disponível agora
Disponível agora
Nosso modelo multimodal mais rápido com ótimo desempenho para tarefas diversas e repetitivas e uma janela de contexto de 1 milhão. Agora em disponibilidade geral para uso na produção.
Sem custo financeiro*
Limites de taxa**
15 RPM (solicitações por minuto)
1 milhão de TPM (tokens por minuto)
1.500 RPD (solicitações por dia)
Preço (entrada)
Sem custo financeiro
O armazenamento em cache de contexto
Sem custo financeiro, até 1 milhão de tokens de armazenamento por hora
Preço (saída)
Sem custo financeiro
Comandos/respostas usados para melhorar nossos produtos
Sim
Pagamento por uso (preços em USD)***
Limites de taxa**
1.000 RPM (solicitações por minuto)
4 milhões de TPM (tokens por minuto)
Preço (entrada)
US$ 0,35 / 1 milhão de tokens (para prompts de até 128 mil tokens)
US$ 0,70 / 1 milhão de tokens (para solicitações maiores que 128 mil)
O armazenamento em cache de contexto
US$ 0,0875 / 1 milhão de tokens (para prompts de até 128 mil tokens)
US$ 0,175 / 1 milhão de tokens (para prompts maiores que 128 mil)
US$ 1,00 / 1 milhão de tokens por hora (armazenamento)
Preço (saída)
US$ 1,05 / 1 milhão de tokens (para prompts de até 128 mil tokens)
US$ 2,10 / 1 milhão de tokens (para solicitações maiores que 128 mil)
Comandos/respostas usados para melhorar nossos produtos
Não
Nosso modelo de última geração com uma janela de contexto inovadora de 2 milhões. Agora em disponibilidade geral para uso na produção.
Sem custo financeiro*
Limites de taxa**
2 RPM (solicitações por minuto)
32.000 TPM (tokens por minuto)
50 RPD (solicitações por dia)
Preço (entrada)
Sem custo financeiro
O armazenamento em cache de contexto
Não relevante
Preço (saída)
Sem custo financeiro
Comandos/respostas usados para melhorar nossos produtos
Sim
Pagamento por uso (preços em USD)***
Limites de taxa**
360 RPM (solicitações por minuto)
4 milhões de TPM (tokens por minuto)
10.000 RPD (solicitações por dia)
Preço (entrada)
US$ 3,50 / 1 milhão de tokens (para solicitações de até 128 mil tokens)
US$ 7,00 / 1 milhão de tokens (para solicitações maiores que 128 mil)
O armazenamento em cache de contexto
US$ 0,875 / 1 milhão de tokens (para prompts de até 128 mil tokens)
US$ 1,75 / 1 milhão de tokens (para solicitações maiores que 128 mil)
US$ 4,50 / 1 milhão de tokens por hora (armazenamento)
Preço (saída)
US$ 10,50 / 1 milhão de tokens (para prompts de até 128 mil tokens)
US$ 21,00 / 1 milhão de tokens (para prompts maiores que 128 mil)
Comandos/respostas usados para melhorar nossos produtos
Não
Nosso modelo de primeira geração oferece somente raciocínio de texto e imagem. Disponibilidade geral para uso na produção.
Sem custo financeiro*
Limites de taxa**
15 RPM (solicitações por minuto)
32.000 TPM (tokens por minuto)
1.500 RPD (solicitações por dia)
Preço (entrada)
Sem custo financeiro
O armazenamento em cache de contexto
Não relevante
Preço (saída)
Sem custo financeiro
Comandos/respostas usados para melhorar nossos produtos
Sim
Pagamento por uso (preços em USD)***
Limites de taxa**
360 RPM (solicitações por minuto)
120.000 TPM (tokens por minuto)
30.000 RPD (solicitações por dia)
Preço (entrada)
US$ 0,50 / 1 milhão de tokens
O armazenamento em cache de contexto
Indisponível
Preço (saída)
US$ 1,50 / 1 milhão de tokens
Comandos/respostas usados para melhorar nossos produtos
Não
*As restrições de uso do nível sem custo financeiro da API Gemini se aplicam ao EEE (incluindo a UE), ao Reino Unido e à Suíça. Consulte Perguntas frequentes sobre faturamento para mais detalhes.
**Os limites de taxa especificados não são garantidos, e a capacidade real pode variar. Inscreva-se para aumentar o limite máximo de taxa (somente para o nível pago).
***Os custos de inferência de modelos ajustados são cobrados com o mesmo preço dos modelos base. Para receber ajuda com faturamento, consulte Suporte do Cloud Billing.
****Os preços podem ser diferentes dos listados aqui e dos oferecidos na Vertex AI. Para preços da Vertex, consulte a documentação da Vertex.
Crie com Vertex AI no Google Cloud