1.5 Flash
Nosso modelo multimodal mais equilibrado, com ótimo desempenho para a maioria das tarefas
- Inserir áudio, imagens, vídeo e texto e receber respostas em texto
- Gerar código, extrair dados, editar texto e muito mais
- Ideal para tarefas que exigem equilíbrio entre desempenho e custo
1.5 Flash-8B
Nosso modelo multimodal mais rápido e econômico com ótimo desempenho para tarefas de alta frequência
- Inserir áudio, imagens, vídeo e texto e receber respostas em texto
- Gerar código, extrair dados, editar texto e muito mais
- Melhor para tarefas de alta frequência e inteligência mais baixa
Variantes de modelo
A API Gemini oferece diferentes modelos otimizados para casos de uso específicos. Confira uma breve descrição das variantes do Gemini disponíveis:
Variante do modelo | Entrada(s) | Saída | Otimizado para |
---|---|---|---|
Gemini 1.5 Flash
gemini-1.5-flash |
Áudio, imagens, vídeos e texto | Texto | Desempenho rápido e versátil para várias tarefas |
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b |
Áudio, imagens, vídeos e texto | Texto | Tarefas de alto volume e menor inteligência |
Gemini 1.5 Pro
gemini-1.5-pro |
Áudio, imagens, vídeos e texto | Texto | Tarefas de raciocínio complexas que exigem mais inteligência |
Gemini 1.0 Pro
gemini-1.0-pro |
Texto | Texto | Tarefas de linguagem natural, chat de código e texto com várias interações e geração de código |
Incorporação de texto
text-embedding-004 |
Texto | Embeddings de textos | Como medir a relação entre strings de texto |
AQA
aqa |
Texto | Texto | Fornecer respostas com base em fontes confiáveis |
Gemini 1.5 Flash
O Gemini 1.5 Flash é um modelo multimodal rápido e versátil para escalonamento em diversas tarefas.
Detalhes do modelo
Propriedade | Descrição |
---|---|
Código do modelo | models/gemini-1.5-flash |
tipos de dados com suporte |
Entradas (link em inglês) Áudio, imagens, vídeo e texto Saída Texto |
[*] | Limites de token
Limite de tokens de entrada 1.048.576 Limite de token de saída 8.192 |
Especificações de áudio/visual |
Número máximo de imagens por comando 3.600 Duração máxima do vídeo 1 hora Comprimento máximo do áudio Aproximadamente 9,5 horas |
[**] | Limites de taxa
|
Recursos de |
Instruções do sistema Compatível Modo JSON Compatível Esquema JSON Compatível Configurações de segurança ajustáveis Compatível Armazenamento em cache Compatível Ajuste Compatível Chamadas de função Compatível Execução de código Compatível |
Versões |
|
Atualização mais recente | Setembro de 2024 |
Gemini 1.5 Flash-8B
O Gemini 1.5 Flash-8B é um modelo pequeno projetado para tarefas de inteligência mais baixa.
Detalhes do modelo
Propriedade | Descrição |
---|---|
Código do modelo | models/gemini-1.5-flash-8b |
tipos de dados com suporte |
Entradas (link em inglês) Áudio, imagens, vídeo e texto Saída Texto |
[*] | Limites do token
Limite de tokens de entrada 1.048.576 Limite de token de saída 8.192 |
Especificações de áudio/visual |
Número máximo de imagens por comando 3.600 Duração máxima do vídeo 1 hora Comprimento máximo do áudio Aproximadamente 9,5 horas |
[**] | Limites de taxa
|
Recursos de |
Instruções do sistema Compatível Modo JSON Compatível Esquema JSON Compatível Configurações de segurança ajustáveis Compatível Armazenamento em cache Compatível Ajuste Compatível Chamadas de função Compatível Execução de código Compatível |
Versões |
|
Atualização mais recente | Outubro de 2024 |
Gemini 1.5 Pro
O Gemini 1.5 Pro é um modelo multimodal de tamanho médio otimizado para uma ampla variedade de tarefas de raciocínio. O 1.5 Pro pode processar grandes quantidades de dados de uma vez, incluindo duas horas de vídeo, 19 horas de áudio, bases de código com 60.000 linhas de código ou 2.000 páginas de texto.
Detalhes do modelo
Propriedade | Descrição |
---|---|
Código do modelo | models/gemini-1.5-pro |
tipos de dados com suporte |
Entradas (link em inglês) Áudio, imagens, vídeo e texto Saída Texto |
[*] | Limites de token
Limite de tokens de entrada 2.097.152 Limite de token de saída 8.192 |
Especificações de áudio/visual |
Número máximo de imagens por comando 7.200 Duração máxima do vídeo 2 horas Duração máxima do áudio Aproximadamente 19 horas |
[**] | Limites de taxa
|
Recursos de |
Instruções do sistema Compatível Modo JSON Compatível Esquema JSON Compatível Configurações de segurança ajustáveis Compatível Armazenamento em cache Compatível Ajuste incompatível Chamadas de função Compatível Execução de código Compatível |
Versões |
|
Atualização mais recente | Setembro de 2024 |
Gemini 1.0 Pro
O Gemini 1.0 Pro é um modelo de PLN que processa tarefas como chat de código e texto com várias interações e geração de código.
Detalhes do modelo
Propriedade | Descrição |
---|---|
Código do modelo | models/gemini-1.0-pro |
Tipos de dados compatíveis |
Entrada Texto Saída Texto |
[**] | Limites de taxa
|
Recursos de |
Instruções do sistema incompatível Modo JSON incompatível Esquema JSON incompatível Configurações de segurança ajustáveis Compatível Armazenamento em cache incompatível Ajuste Compatível Chamadas de função Compatível Configuração da chamada de função incompatível Execução de código incompatível |
Versões |
|
Atualização mais recente | Fevereiro de 2024 |
Incorporação de texto e embedding
Incorporação de texto
As incorporações de texto são usadas para medir a relação entre strings e são amplamente utilizadas em muitos aplicativos de IA.
O text-embedding-004
alcança uma performance de recuperação mais forte e supera os modelos atuais
com dimensões semelhantes, nos comparativos de referência de incorporação do MTEB padrão.
Detalhes do modelo
Propriedade | Descrição |
---|---|
Código do modelo |
API Gemini
|
tipos de dados com suporte |
Entrada Texto Saída Embeddings de textos |
[*] | Limites do token
Limite de tokens de entrada 2.048 Tamanho da dimensão de saída 768 |
[**] | Limites de taxa1.500 solicitações por minuto |
Configurações de segurança ajustáveis | incompatível |
Atualização mais recente | Abril de 2024 |
Incorporação
Você pode usar o modelo de embedding para gerar embeddings de texto para textos de entrada.
O modelo de embedding é otimizado para criar embeddings com 768 dimensões para textos de até 2.048 tokens.
Detalhes do modelo de embedding
Propriedade | Descrição |
---|---|
Código do modelo |
models/embedding-001
|
Tipos de dados compatíveis |
Entrada Texto Saída Embeddings de textos |
[*] | Limites de token
Limite de tokens de entrada 2.048 Tamanho da dimensão de saída 768 |
[**] | Limites de taxa1.500 solicitações por minuto |
Configurações de segurança ajustáveis | incompatível |
Atualização mais recente | Dezembro de 2023 |
AQA
É possível usar o modelo AQA para realizar tarefas relacionadas a respostas a perguntas atribuídas (AQA, na sigla em inglês) em um documento, corpus ou conjunto de passagens. O modelo AQA retorna respostas para perguntas com base nas fontes fornecidas, além de estimar a probabilidade de resposta.
Detalhes do modelo
Propriedade | Descrição |
---|---|
Código do modelo | models/aqa |
Tipos de dados compatíveis |
Entrada Texto Saída Texto |
Idioma compatível | Inglês |
[*] | Limites de token
Limite de tokens de entrada 7.168 Limite de tokens de saída 1.024 |
[**] | Limites de taxa1.500 solicitações por minuto |
Configurações de segurança ajustáveis | Compatível |
Atualização mais recente | Dezembro de 2023 |
Consulte os exemplos para conhecer os recursos dessas variações de modelo.
[*] Um token equivale a cerca de quatro caracteres para modelos Gemini. 100 tokens equivalem a cerca de 60 a 80 palavras em inglês.
[**] RPM: solicitações por minuto
TPM: tokens por minuto
RPD: solicitações por dia
TPD: tokens por dia
Devido a limitações de capacidade, os limites máximos de taxa especificados não são
garantidos.
Padrões de nome de versão do modelo
Os modelos do Gemini estão disponíveis nas versões de pré-lançamento ou estáveis. No código, é possível usar um dos formatos de nome de modelo a seguir para especificar qual modelo e versão você quer usar.
Mais recente:aponta para a versão mais recente do modelo para uma geração e variação especificadas. O modelo subjacente é atualizado regularmente e pode ser uma versão de pré-lançamento. Apenas apps de teste exploratório e protótipos devem usar esse alias.
Para especificar a versão mais recente, use o seguinte padrão:
<model>-<generation>-<variation>-latest
. Por exemplo,gemini-1.0-pro-latest
.Versão estável mais recente:aponta para a versão estável mais recente lançada para a geração e variação do modelo especificado.
Para especificar a versão estável mais recente, use o seguinte padrão:
<model>-<generation>-<variation>
. Por exemplo,gemini-1.0-pro
.Estável:aponta para um modelo estável específico. Os modelos estáveis não mudam. A maioria dos apps de produção precisa usar um modelo estável específico.
Para especificar uma versão estável, use o seguinte padrão:
<model>-<generation>-<variation>-<version>
. Por exemplo,gemini-1.0-pro-001
.Experimental:aponta para um modelo experimental disponível na prévia, conforme definido nos Termos, ou seja, não é para uso em produção. Lançamos modelos experimentais para coletar feedback, levar nossas atualizações mais recentes aos desenvolvedores rapidamente e destacar o ritmo das inovações que estão acontecendo no Google. O que aprendemos com os lançamentos experimentais informa como lançamos modelos mais amplamente. Um modelo experimental pode ser trocado por outro sem aviso prévio. Não garantimos que um modelo experimental se torne um modelo estável no futuro.
Para especificar uma versão experimental, use o seguinte padrão:
<model>-<generation>-<variation>-<version>
. Por exemplo,gemini-1.5-pro-exp-0827
.
Idiomas disponíveis
Os modelos do Gemini são treinados para funcionar com os seguintes idiomas:
- Árabe (
ar
) - Bengalês (
bn
) - Búlgaro (
bg
) - Chinês (simplificado e tradicional) (
zh
) - Croata (
hr
) - República Tcheca (
cs
) - Coreano (
da
) - Holandês (
nl
) - Inglês (
en
) - Estoniano (
et
) - Finlandês (
fi
) - Francês (
fr
) - Alemão (
de
) - Grego (
el
) - Hebraico (
iw
) - Hindi (
hi
) - Húngaro (
hu
) - Indonésio (
id
) - Italiano (
it
) - Japonês (
ja
) - Coreano (
ko
) - Letão (
lv
) - Lituano (
lt
) - Norueguês (
no
) - Polonês (
pl
) - Português (
pt
) - Romeno (
ro
) - Russo (
ru
) - Sérvio (
sr
) - Eslovaco (
sk
) - Esloveno (
sl
) - Espanhol (
es
) - Suaíli (
sw
) - Sueco (
sv
) - Tailandês (
th
) - Turco (
tr
) - Ucraniano (
uk
) - Vietnamita (
vi
)