1.5 Flash
Notre modèle multimodal le plus équilibré, offrant d'excellentes performances pour la plupart des tâches
- Saisissez des contenus audio, des images, des vidéos et du texte, et obtenez des réponses textuelles
- Générer du code, extraire des données, modifier du texte, etc.
- Idéal pour les tâches qui équilibrent performances et coûts
1,5 Flash-8B
Notre modèle multimodal le plus rapide et le plus économique, offrant d'excellentes performances pour les tâches à haute fréquence
- Saisissez des contenus audio, des images, des vidéos et du texte, et obtenez des réponses textuelles
- Générer du code, extraire des données, modifier du texte, etc.
- Idéal pour les tâches à faible intelligence et à haute fréquence
1.5 Pro
Notre modèle multimodal le plus performant, avec des fonctionnalités adaptées à un large éventail de tâches de raisonnement
- Saisissez des contenus audio, des images, des vidéos et du texte, et obtenez des réponses textuelles
- Générer du code, extraire des données, modifier du texte, etc.
- Pour booster vos performances
Variantes du modèle
L'API Gemini propose différents modèles optimisés pour des cas d'utilisation spécifiques. Voici un bref aperçu des variantes de Gemini disponibles:
Variante du modèle | Entrées | Sortie | Optimisé pour |
---|---|---|---|
Gemini 1.5 Flash
gemini-1.5-flash |
Audio, images, vidéos et texte | Texte | Performances rapides et polyvalentes pour diverses tâches |
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b |
Audio, images, vidéos et texte | Texte | Tâches à fort volume et à faible intelligence |
Gemini 1.5 Pro
gemini-1.5-pro |
Audio, images, vidéos et texte | Texte | Tâches de raisonnement complexes nécessitant plus d'intelligence |
Gemini 1.0 Pro (obsolète le 15/02/2025)
gemini-1.0-pro |
Texte | Texte | Tâches en langage naturel, chat textuel et de code multitours, et génération de code |
Embedding textuel
text-embedding-004 |
Texte | Embeddings textuels | Mesurer la relation entre des chaînes de texte |
AQA
aqa |
Texte | Texte | Fournir des réponses aux questions basées sur des sources |
Gemini 1.5 Flash
Gemini 1.5 Flash est un modèle multimodal rapide et polyvalent, adapté à un large éventail de tâches.
Informations sur le modèle
Propriété | Description |
---|---|
: code du modèle | models/gemini-1.5-flash |
Types de données acceptés |
Entrées Audio, images, vidéos et texte Sortie Texte |
[*] | Limites de jeton
Limite de jetons d'entrée 1 048 576 Limite de jetons de sortie 8 192 |
Spécifications audio/visuelles |
Nombre maximal d'images par requête 3 600 Durée maximale de la vidéo 1 heure Durée audio maximale Environ 9,5 heures |
[**] | Limites de débit
|
Fonctionnalités de |
Instructions système Compatible Mode JSON Compatible Schéma JSON Compatible Paramètres de sécurité ajustables Compatible Mise en cache Compatible Accordage Compatible Appel de fonction Compatible Exécution du code Compatible |
Versions |
|
Dernière mise à jour | Septembre 2024 |
Gemini 1.5 Flash-8B
Gemini 1.5 Flash-8B est un petit modèle conçu pour les tâches d'intelligence de moindre envergure.
Informations sur le modèle
Propriété | Description |
---|---|
: code du modèle | models/gemini-1.5-flash-8b |
Types de données acceptés |
Entrées Audio, images, vidéos et texte Sortie Texte |
[*] | Limites de jeton
Limite de jetons d'entrée 1 048 576 Limite de jetons de sortie 8 192 |
Spécifications audio/visuelles |
Nombre maximal d'images par requête 3 600 Durée maximale de la vidéo 1 heure Durée audio maximale Environ 9,5 heures |
[**] | Limites de débit
|
Fonctionnalités de |
Instructions système Compatible Mode JSON Compatible Schéma JSON Compatible Paramètres de sécurité ajustables Compatible Mise en cache Compatible Accordage Compatible Appel de fonction Compatible Exécution du code Compatible |
Versions |
|
Dernière mise à jour | Octobre 2024 |
Gemini 1.5 Pro
Gemini 1.5 Pro est un modèle multimodal de taille moyenne optimisé pour un large éventail de tâches de raisonnement. 1.5 Pro peut traiter de grandes quantités de données en même temps, y compris deux heures de vidéo, 19 heures d'audio, des codebases de 60 000 lignes de code ou 2 000 pages de texte.
Informations sur le modèle
Propriété | Description |
---|---|
: code du modèle | models/gemini-1.5-pro |
Types de données acceptés |
Entrées Audio, images, vidéos et texte Sortie Texte |
[*] | Limites de jeton
Limite de jetons d'entrée 2 097 152 Limite de jetons de sortie 8 192 |
Spécifications audio/visuelles |
Nombre maximal d'images par requête 7 200 Durée maximale de la vidéo 2 heures Durée audio maximale Environ 19 heures |
[**] | Limites de débit
|
Fonctionnalités de |
Instructions système Compatible Mode JSON Compatible Schéma JSON Compatible Paramètres de sécurité ajustables Compatible Mise en cache Compatible Accordage Not supported Appel de fonction Compatible Exécution du code Compatible |
Versions |
|
Dernière mise à jour | Septembre 2024 |
Gemini 1.0 Pro (obsolète)
Gemini 1.0 Pro est un modèle de traitement du langage naturel qui gère des tâches telles que le chat textuel et de code multitour, ainsi que la génération de code.
Informations sur le modèle
Propriété | Description |
---|---|
: code du modèle | models/gemini-1.0-pro |
Types de données acceptés |
Entrée Texte Sortie Texte |
[**] | Limites de débit
|
Fonctionnalités de |
Instructions système Not supported Mode JSON Not supported Schéma JSON Not supported Paramètres de sécurité ajustables Compatible Mise en cache Not supported Accordage Compatible Appel de fonction Compatible Configuration des appels de fonction Not supported Exécution du code Not supported |
Versions |
|
Dernière mise à jour | Février 2024 |
Embedding textuel et embeddings
Embedding textuel
Les embeddings de texte sont utilisés pour mesurer la proximité des chaînes et sont largement utilisés dans de nombreuses applications d'IA.
text-embedding-004
offre des meilleures performances de récupération et surpasse les modèles existants avec des dimensions comparables, sur les benchmarks d'encapsulation MTEB standards.
Informations sur le modèle
Propriété | Description |
---|---|
: code du modèle |
API Gemini
|
Types de données acceptés |
Entrée Texte Sortie Embeddings textuels |
[*] | Limites de jeton
Limite de jetons d'entrée 2 048 Taille de la dimension de sortie 768 |
[**] | Limites de débit1 500 requêtes par minute |
Not supported | |
Dernière mise à jour | Avril 2024 |
Embedding
Vous pouvez utiliser le modèle d'embedding pour générer des embeddings de texte pour le texte d'entrée.
Le modèle d'embedding est optimisé pour créer des embeddings à 768 dimensions pour un texte de 2 048 jetons maximum.
Détails du modèle d'embedding
Propriété | Description |
---|---|
: code du modèle |
models/embedding-001
|
Types de données acceptés |
Entrée Texte Sortie Embeddings textuels |
[*] | Limites de jeton
Limite de jetons d'entrée 2 048 Taille de la dimension de sortie 768 |
[**] | Limites de débit1 500 requêtes par minute |
Not supported | |
Dernière mise à jour | Décembre 2023 |
AQA
Vous pouvez utiliser le modèle AQA pour effectuer des tâches liées à la résolution de questions attribuée (AQA) sur un document, un corpus ou un ensemble de passages. Le modèle AQA renvoie des réponses aux questions fondées sur les sources fournies, ainsi qu'une estimation de la probabilité de réponse.
Informations sur le modèle
Propriété | Description |
---|---|
: code du modèle | models/aqa |
Types de données acceptés |
Entrée Texte Sortie Texte |
Langue acceptée | Anglais |
[*] | Limites de jeton
Limite de jetons d'entrée 7,168 Limite de jetons de sortie 1 024 |
[**] | Limites de débit1 500 requêtes par minute |
Compatible | |
Dernière mise à jour | Décembre 2023 |
Consultez les exemples pour découvrir les fonctionnalités de ces variantes de modèle.
[*] Un jeton équivaut à environ quatre caractères pour les modèles Gemini. 100 jetons correspondent à environ 60-80 mots en anglais.
[**] RPM: requêtes par minute
TPM: jetons par minute
RPD: requêtes par jour
TPD: jetons par jour
En raison des limites de capacité, les limites de débit maximales spécifiées ne sont pas garanties.
Modèles de noms de versions de modèle
Les modèles Gemini sont disponibles en versions preview ou stable. Dans votre code, vous pouvez utiliser l'un des formats de nom de modèle suivants pour spécifier le modèle et la version que vous souhaitez utiliser.
Dernière:indique la version la plus récente du modèle pour une génération et une variante spécifiées. Le modèle sous-jacent est mis à jour régulièrement et peut s'agir d'une version preview. Seuls les prototypes et les applications de test exploratoire doivent utiliser cet alias.
Pour spécifier la dernière version, utilisez le format suivant :
<model>-<generation>-<variation>-latest
. Exemple :gemini-1.0-pro-latest
.Dernière version stable:pointe vers la dernière version stable publiée pour la génération et la variation de modèle spécifiées.
Pour spécifier la dernière version stable, utilisez le format suivant :
<model>-<generation>-<variation>
. Exemple :gemini-1.0-pro
Stable:indique un modèle stable spécifique. Les modèles stables ne changent pas. La plupart des applications de production doivent utiliser un modèle stable spécifique.
Pour spécifier une version stable, utilisez le format suivant :
<model>-<generation>-<variation>-<version>
. Exemple :gemini-1.0-pro-001
.Expérimental:fait référence à un modèle expérimental disponible en version Preview, comme défini dans les Conditions. Il n'est donc pas destiné à une utilisation en production. Nous publions des modèles expérimentaux pour recueillir des commentaires, mettre rapidement nos dernières nouveautés entre les mains des développeurs et mettre en avant le rythme d'innovation de Google. Ce que nous apprenons des lancements expérimentaux nous aide à déployer les modèles à plus grande échelle. Un modèle expérimental peut être remplacé par un autre sans préavis. Nous ne garantissons pas qu'un modèle expérimental deviendra un modèle stable à l'avenir.
Pour spécifier une version expérimentale, utilisez le format suivant :
<model>-<generation>-<variation>-<version>
. Exemple :gemini-exp-1121
.
Langues disponibles
Les modèles Gemini sont entraînés pour fonctionner avec les langues suivantes:
- Arabe (
ar
) - Bengalî (
bn
) - Bulgare (
bg
) - Chinois simplifié et traditionnel (
zh
) - Croate (
hr
) - République tchèque (
cs
) - Danois (
da
) - Néerlandais (
nl
) - Anglais (
en
) - Estonien (
et
) - Finnois (
fi
) - Français (
fr
) - Allemand (
de
) - Grec (
el
) - Hébreu (
iw
) - Hindi (
hi
) - Hongrois (
hu
) - Indonésien (
id
) - Italien (
it
) - Japonais (
ja
) - Coréen (
ko
) - Letton (
lv
) - Lituanien (
lt
) - Norvégien (
no
) - Polonais (
pl
) - Portugais (
pt
) - Roumain (
ro
) - Russe (
ru
) - Serbe (
sr
) - Slovaque (
sk
) - Slovène (
sl
) - Espagnol (
es
) - Swahili (
sw
) - Suédois (
sv
) - Thaï (
th
) - Turc (
tr
) - Ukrainien (
uk
) - Vietnamien (
vi
)