2.0 Flash
Nosso modelo multimodal mais recente, com recursos de última geração e recursos aprimorados
- Entrada de áudio, imagens, vídeo e texto: receba respostas de texto, imagem e áudio
- Oferece interações de conversação de baixa latência com nossa API Multimodal Live
Variantes de modelo
A API Gemini oferece diferentes modelos otimizados para casos de uso específicos. Confira uma breve descrição das variantes disponíveis do Gemini:
Variante de modelo | Entrada(s) | Saída | Otimizado para |
---|---|---|---|
Flash 2.0 do Gemini
gemini-2.0-flash-exp |
Áudio, imagens, vídeos e texto | Texto, imagens (em breve) e áudio (em breve) | Geração multimodal, recursos de última geração e velocidade para uma variedade de tarefas |
Gemini 1.5 Flash
gemini-1.5-flash |
Áudio, imagens, vídeos e texto | Texto | Desempenho rápido e versátil em várias tarefas |
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b |
Áudio, imagens, vídeos e texto | Texto | Tarefas de alto volume e baixa inteligência |
Gemini 1.5 Pro
gemini-1.5-pro |
Áudio, imagens, vídeos e texto | Texto | Tarefas de raciocínio complexas que exigem mais inteligência |
(Descontinuado em 15/02/2025) Gemini 1.0 Pro
gemini-1.0-pro |
Texto | Texto | Tarefas de linguagem natural, chat de código e texto com várias interações e geração de código |
Incorporação de texto
text-embedding-004 |
Texto | Embeddings de textos | Como medir a relação entre strings de texto |
AQA
aqa |
Texto | Texto | Fornecer respostas com base em fontes confiáveis |
(Experimental) Gemini 2.0 Flash
O Gemini 2.0 Flash oferece recursos de última geração e recursos aprimorados, incluindo velocidade superior, uso de ferramentas nativas, geração multimodal e uma janela de contexto de 1 milhão de tokens. Saiba mais sobre o Gemini 2.0 Flash na nossa página de informações gerais.
Detalhes do modelo
Propriedade | Descrição |
---|---|
Código do modelo | models/gemini-2.0-flash-exp |
tipos de dados com suporte |
Entradas (link em inglês) Áudio, imagens, vídeo e texto Saída Áudio (em breve), imagens (em breve) e texto |
[*] | Limites de token
Limite de tokens de entrada 1.048.576 Limite de token de saída 8.192 |
[**] | Limites de taxa
|
(em inglês) |
Saídas estruturadas Compatível Armazenamento em cache incompatível Ajuste incompatível Chamadas de função Compatível Execução de código Compatível Pesquisa Compatível Geração de imagens Compatível Uso de ferramentas nativas Compatível Geração de áudio Compatível |
Versões |
|
Atualização mais recente | Dezembro de 2024 |
Gemini 1.5 Flash
O Gemini 1.5 Flash é um modelo multimodal rápido e versátil para escalonamento em diversas tarefas.
Detalhes do modelo
Propriedade | Descrição |
---|---|
Código do modelo | models/gemini-1.5-flash |
tipos de dados com suporte |
Entradas (link em inglês) Áudio, imagens, vídeo e texto Saída Texto |
[*] | Limites de token
Limite de tokens de entrada 1.048.576 Limite de token de saída 8.192 |
Especificações de áudio/visual |
Número máximo de imagens por comando 3.600 Duração máxima do vídeo 1 hora Duração máxima do áudio Aproximadamente 9,5 horas |
[**] | Limites de taxa
|
(em inglês) |
Instruções do sistema Compatível Modo JSON Compatível Esquema JSON Compatível Configurações de segurança ajustáveis Compatível Armazenamento em cache Compatível Ajuste Compatível Chamadas de função Compatível Execução de código Compatível Streaming bidirecional incompatível |
Versões |
|
Atualização mais recente | Setembro de 2024 |
Gemini 1.5 Flash-8B
O Gemini 1.5 Flash-8B é um modelo pequeno projetado para tarefas de baixa inteligência.
Detalhes do modelo
Propriedade | Descrição |
---|---|
Código do modelo | models/gemini-1.5-flash-8b |
tipos de dados com suporte |
Entradas (link em inglês) Áudio, imagens, vídeo e texto Saída Texto |
[*] | Limites de token
Limite de tokens de entrada 1.048.576 Limite de token de saída 8.192 |
Especificações de áudio/visual |
Número máximo de imagens por comando 3.600 Duração máxima do vídeo 1 hora Duração máxima do áudio Aproximadamente 9,5 horas |
[**] | Limites de taxa
|
(em inglês) |
Instruções do sistema Compatível Modo JSON Compatível Esquema JSON Compatível Configurações de segurança ajustáveis Compatível Armazenamento em cache Compatível Ajuste Compatível Chamadas de função Compatível Execução de código Compatível Streaming bidirecional incompatível |
Versões |
|
Atualização mais recente | Outubro de 2024 |
Gemini 1.5 Pro
O Gemini 1.5 Pro é um modelo multimodal de tamanho médio otimizado para uma ampla variedade de tarefas de raciocínio. O 1.5 Pro pode processar grandes quantidades de dados de uma vez, incluindo duas horas de vídeo, 19 horas de áudio, bases de código com 60.000 linhas de código ou 2.000 páginas de texto.
Detalhes do modelo
Propriedade | Descrição |
---|---|
Código do modelo | models/gemini-1.5-pro |
tipos de dados com suporte |
Entradas (link em inglês) Áudio, imagens, vídeo e texto Saída Texto |
[*] | Limites de token
Limite de tokens de entrada 2.097.152 Limite de token de saída 8.192 |
Especificações de áudio/visual |
Número máximo de imagens por comando 7.200 Duração máxima do vídeo 2 horas Duração máxima do áudio Aproximadamente 19 horas |
[**] | Limites de taxa
|
(em inglês) |
Instruções do sistema Compatível Modo JSON Compatível Esquema JSON Compatível Configurações de segurança ajustáveis Compatível Armazenamento em cache Compatível Ajuste incompatível Chamadas de função Compatível Execução de código Compatível Streaming bidirecional incompatível |
Versões |
|
Atualização mais recente | Setembro de 2024 |
(Descontinuado) Gemini 1.0 Pro
O Gemini 1.0 Pro é um modelo de PLN que processa tarefas como chat de código e texto com várias interações e geração de código.
Detalhes do modelo
Propriedade | Descrição |
---|---|
Código do modelo | models/gemini-1.0-pro |
tipos de dados com suporte |
Entrada Texto Saída Texto |
[**] | Limites de taxa
|
(em inglês) |
Instruções do sistema incompatível Modo JSON incompatível Esquema JSON incompatível Configurações de segurança ajustáveis Compatível Armazenamento em cache incompatível Ajuste Compatível Chamadas de função Compatível Configuração de chamada de função incompatível Execução de código incompatível Streaming bidirecional incompatível |
Versões |
|
Atualização mais recente | Fevereiro de 2024 |
Incorporação de texto e embedding
Incorporação de texto
As incorporações de texto são usadas para medir a relação entre strings e são amplamente utilizadas em muitos aplicativos de IA.
O text-embedding-004
alcança uma performance de recuperação mais forte e supera os modelos atuais
com dimensões semelhantes, nos comparativos de referência de incorporação do MTEB padrão.
Detalhes do modelo
Propriedade | Descrição |
---|---|
Código do modelo |
API Gemini
|
tipos de dados com suporte |
Entrada Texto Saída Embeddings de textos |
[*] | Limites de token
Limite de tokens de entrada 2.048 Tamanho da dimensão de saída 768 |
[**] | Limites de taxa1.500 solicitações por minuto |
Configurações de segurança ajustáveis | incompatível |
Atualização mais recente | Abril de 2024 |
Incorporação
Você pode usar o modelo de embedding para gerar embeddings de texto para textos de entrada.
O modelo de embedding é otimizado para criar embeddings com 768 dimensões para textos de até 2.048 tokens.
Detalhes do modelo de embedding
Propriedade | Descrição |
---|---|
Código do modelo |
models/embedding-001
|
tipos de dados com suporte |
Entrada Texto Saída Embeddings de textos |
[*] | Limites de token
Limite de tokens de entrada 2.048 Tamanho da dimensão de saída 768 |
[**] | Limites de taxa1.500 solicitações por minuto |
Configurações de segurança ajustáveis | incompatível |
Atualização mais recente | Dezembro de 2023 |
AQA
É possível usar o modelo AQA para realizar tarefas relacionadas a respostas a perguntas atribuídas (AQA, na sigla em inglês) em um documento, corpus ou conjunto de passagens. O modelo AQA retorna respostas a perguntas com base nas fontes fornecidas, além de estimar a probabilidade de resposta.
Detalhes do modelo
Propriedade | Descrição |
---|---|
Código do modelo | models/aqa |
tipos de dados com suporte |
Entrada Texto Saída Texto |
Idioma com suporte | Inglês |
[*] | Limites de token
Limite de tokens de entrada 7.168 Limite de token de saída 1.024 |
[**] | Limites de taxa1.500 solicitações por minuto |
Configurações de segurança ajustáveis | Compatível |
Atualização mais recente | Dezembro de 2023 |
Consulte os exemplos para conhecer os recursos dessas variações de modelo.
[*] Um token equivale a cerca de quatro caracteres para modelos do Gemini. 100 tokens equivalem a cerca de 60 a 80 palavras em inglês.
[**] RPM: solicitações por minuto
TPM: tokens por minuto
RPD: solicitações por dia
TPD: tokens por dia
Devido a limitações de capacidade, os limites máximos de taxa especificados não são
garantidos.
Padrões de nome de versão do modelo
Os modelos do Gemini estão disponíveis nas versões de pré-lançamento ou estáveis. No seu código, use um dos formatos de nome de modelo a seguir para especificar qual modelo e versão você quer usar.
Mais recente:aponta para a versão mais recente do modelo para uma geração e variação especificadas. O modelo subjacente é atualizado regularmente e pode ser uma versão de pré-lançamento. Apenas apps de teste exploratório e protótipos devem usar esse alias.
Para especificar a versão mais recente, use o seguinte padrão:
<model>-<generation>-<variation>-latest
. Por exemplo,gemini-1.0-pro-latest
.Versão estável mais recente:aponta para a versão estável mais recente lançada para a geração e variação de modelo especificadas.
Para especificar a versão estável mais recente, use o seguinte padrão:
<model>-<generation>-<variation>
. Por exemplo,gemini-1.0-pro
.Estável:aponta para um modelo estável específico. Os modelos estáveis não mudam. A maioria dos apps de produção precisa usar um modelo estável específico.
Para especificar uma versão estável, use o seguinte padrão:
<model>-<generation>-<variation>-<version>
. Por exemplo,gemini-1.0-pro-001
.Experimental:aponta para um modelo experimental disponível na prévia, conforme definido nos Termos, o que significa que ele não é para uso em produção. Lançamos modelos experimentais para coletar feedback, disponibilizar nossas atualizações mais recentes aos desenvolvedores rapidamente e destacar o ritmo de inovação do Google. O que aprendemos com os lançamentos experimentais nos ajuda a disponibilizar modelos de maneira mais abrangente. Um modelo experimental pode ser trocado por outro sem aviso prévio. Não garantimos que um modelo experimental se torne um modelo estável no futuro.
Para especificar uma versão experimental, use o seguinte padrão:
<model>-<generation>-<variation>-<version>
. Por exemplo,gemini-exp-1121
.
Idiomas disponíveis
Os modelos do Gemini são treinados para funcionar com os seguintes idiomas:
- Árabe (
ar
) - Bengalês (
bn
) - Búlgaro (
bg
) - Chinês (simplificado e tradicional) (
zh
) - Croata (
hr
) - República Tcheca (
cs
) - Coreano (
da
) - Holandês (
nl
) - Inglês (
en
) - Estoniano (
et
) - Finlandês (
fi
) - Francês (
fr
) - Alemão (
de
) - Grego (
el
) - Hebraico (
iw
) - Hindi (
hi
) - Húngaro (
hu
) - Indonésio (
id
) - Italiano (
it
) - Japonês (
ja
) - Coreano (
ko
) - Letão (
lv
) - Lituano (
lt
) - Norueguês (
no
) - Polonês (
pl
) - Português (
pt
) - Romeno (
ro
) - Russo (
ru
) - Sérvio (
sr
) - Eslovaco (
sk
) - Esloveno (
sl
) - Espanhol (
es
) - Suaíli (
sw
) - Sueco (
sv
) - Tailandês (
th
) - Turco (
tr
) - Ucraniano (
uk
) - Vietnamita (
vi
)