Modèles Gemini

Variantes du modèle

L'API Gemini propose différents modèles optimisés pour des cas d'utilisation spécifiques. Voici un bref aperçu des variantes de Gemini disponibles:

Variante du modèle Entrées Sortie Optimisé pour
Gemini 1.5 Flash
gemini-1.5-flash
Audio, images, vidéos et texte Texte Performances rapides et polyvalentes pour diverses tâches
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
Audio, images, vidéos et texte Texte Tâches à fort volume et à faible intelligence
Gemini 1.5 Pro
gemini-1.5-pro
Audio, images, vidéos et texte Texte Tâches de raisonnement complexes nécessitant plus d'intelligence
Gemini 1.0 Pro (obsolète le 15/02/2025)
gemini-1.0-pro
Texte Texte Tâches en langage naturel, chat textuel et de code multitours, et génération de code
Embedding textuel
text-embedding-004
Texte Embeddings textuels Mesurer la similarité entre des chaînes de texte
AQA
aqa
Texte Texte Fournir des réponses aux questions basées sur des sources

Gemini 1.5 Flash

Gemini 1.5 Flash est un modèle multimodal rapide et polyvalent, adapté à un large éventail de tâches.

Essayer dans AI Studio

Informations sur le modèle

Propriété Description
 : code du modèle models/gemini-1.5-flash
 : types de données acceptés

Entrées

Audio, images, vidéos et texte

Sortie

Texte

Limites de jeton[*]

Limite de jetons d'entrée

1 048 576

Limite de jetons de sortie

8 192

Spécifications audio/visuelles

Nombre maximal d'images par requête

3 600

Durée maximale de la vidéo

1 heure

Durée audio maximale

Environ 9,5 heures

Limites de débit[**]
Sans frais
  • 15 RPM
  • 1 million de TPM
  • 1 500 RPM
Pay-as-you-go:
  • 2 000 RPM
  • 4 millions de TPM
Fonctionnalités de

Instructions système

Compatible

Mode JSON

Compatible

Schéma JSON

Compatible

Paramètres de sécurité ajustables

Compatible

Mise en cache

Compatible

Accordage

Compatible

Appel de fonction

Compatible

Exécution du code

Compatible

Versions
Pour en savoir plus, consultez les modèles de version de modèle.
  • Dernier e-mail : gemini-1.5-flash-latest
  • Dernière version stable: gemini-1.5-flash
  • Stable:
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
  • Expérimental:
    • gemini-1.5-flash-8b-exp-0924
    • gemini-1.5-flash-8b-exp-0827
    • gemini-1.5-flash-exp-0827
Dernière mise à jour Septembre 2024

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B est un petit modèle conçu pour les tâches d'intelligence de moindre envergure.

Essayer dans AI Studio

Informations sur le modèle

Propriété Description
 : code du modèle models/gemini-1.5-flash-8b
 : types de données acceptés

Entrées

Audio, images, vidéos et texte

Sortie

Texte

Limites de jeton[*]

Limite de jetons d'entrée

1 048 576

Limite de jetons de sortie

8 192

Spécifications audio/visuelles

Nombre maximal d'images par requête

3 600

Durée maximale de la vidéo

1 heure

Durée audio maximale

Environ 9,5 heures

Limites de débit[**]
Sans frais
  • 15 RPM
  • 1 million de TPM
  • 1 500 RPM
Pay-as-you-go:
  • 4 000 RPM
  • 4 millions de TPM
Fonctionnalités de

Instructions système

Compatible

Mode JSON

Compatible

Schéma JSON

Compatible

Paramètres de sécurité ajustables

Compatible

Mise en cache

Compatible

Accordage

Compatible

Appel de fonction

Compatible

Exécution du code

Compatible

Versions
Pour en savoir plus, consultez les modèles de version de modèle.
  • Dernier e-mail : gemini-1.5-flash-8b-latest
  • Dernière version stable: gemini-1.5-flash-8b
  • Stable:
    • gemini-1.5-flash-8b-001
Dernière mise à jour Octobre 2024

Gemini 1.5 Pro

Gemini 1.5 Pro est un modèle multimodal de taille moyenne optimisé pour un large éventail de tâches de raisonnement. 1.5 Pro peut traiter de grandes quantités de données à la fois, y compris deux heures de vidéo, 19 heures d'audio, des codebases de 60 000 lignes de code ou 2 000 pages de texte.

Essayer dans AI Studio

Informations sur le modèle

Propriété Description
 : code du modèle models/gemini-1.5-pro
 : types de données acceptés

Entrées

Audio, images, vidéos et texte

Sortie

Texte

Limites de jeton[*]

Limite de jetons d'entrée

2 097 152

Limite de jetons de sortie

8 192

Spécifications audio/visuelles

Nombre maximal d'images par requête

7 200

Durée maximale de la vidéo

2 heures

Durée audio maximale

Environ 19 heures

Limites de débit[**]
Sans frais
  • 2 tr/min
  • 32 000 TPM
  • 50 RPD
Pay-as-you-go:
  • 1 000 RPM
  • 4 millions de TPM
Fonctionnalités de

Instructions système

Compatible

Mode JSON

Compatible

Schéma JSON

Compatible

Paramètres de sécurité ajustables

Compatible

Mise en cache

Compatible

Accordage

Not supported

Appel de fonction

Compatible

Exécution du code

Compatible

Versions
Pour en savoir plus, consultez les modèles de version de modèle.
  • Dernier e-mail : gemini-1.5-pro-latest
  • Dernière version stable: gemini-1.5-pro
  • Stable:
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
  • Expérimental:
    • gemini-1.5-pro-exp-0827
Dernière mise à jour Septembre 2024

Gemini 1.0 Pro (obsolète)

Gemini 1.0 Pro est un modèle de traitement du langage naturel qui gère des tâches telles que le chat textuel et de code multitour, ainsi que la génération de code.

Essayer dans AI Studio

Informations sur le modèle

Propriété Description
 : code du modèle models/gemini-1.0-pro
 : types de données acceptés

Entrée

Texte

Sortie

Texte

Limites de débit[**]
Sans frais
  • 15 RPM
  • 32 000 TPM
  • 1 500 RPM
Pay-as-you-go:
  • 360 tr/min
  • 120 000 TPM
  • 30 000 RPM
Fonctionnalités de

Instructions système

Not supported

Mode JSON

Not supported

Schéma JSON

Not supported

Paramètres de sécurité ajustables

Compatible

Mise en cache

Not supported

Accordage

Compatible

Appel de fonction

Compatible

Configuration des appels de fonction

Not supported

Exécution du code

Not supported

Versions
  • Dernier e-mail : gemini-1.0-pro-latest
  • Dernière version stable: gemini-1.0-pro
  • Stable: gemini-1.0-pro-001
Dernière mise à jour Février 2024

Embeddings de texte et embeddings

Embedding textuel

Les embeddings de texte sont utilisés pour mesurer la similarité des chaînes et sont largement utilisés dans de nombreuses applications d'IA.

text-embedding-004 offre des meilleures performances de récupération et surpasse les modèles existants avec des dimensions comparables, sur les benchmarks d'encapsulation MTEB standards.

Informations sur le modèle
Propriété Description
 : code du modèle

API Gemini

models/text-embedding-004

 : types de données acceptés

Entrée

Texte

Sortie

Embeddings textuels

Limites de jeton[*]

Limite de jetons d'entrée

2 048

Taille de la dimension de sortie

768

Limites de débit[**] 1 500 requêtes par minute
Not supported
Dernière mise à jour Avril 2024

Embedding

Vous pouvez utiliser le modèle d'embedding pour générer des embeddings de texte pour le texte d'entrée.

Le modèle d'embedding est optimisé pour créer des embeddings à 768 dimensions pour un texte de 2 048 jetons maximum.

Détails du modèle d'embedding
Propriété Description
 : code du modèle models/embedding-001
 : types de données acceptés

Entrée

Texte

Sortie

Embeddings textuels

Limites de jeton[*]

Limite de jetons d'entrée

2 048

Taille de la dimension de sortie

768

Limites de débit[**] 1 500 requêtes par minute
Not supported
Dernière mise à jour Décembre 2023

AQA

Vous pouvez utiliser le modèle AQA pour effectuer des tâches liées à la résolution de questions attribuée (AQA) sur un document, un corpus ou un ensemble de passages. Le modèle AQA renvoie des réponses aux questions qui sont fondées sur les sources fournies, ainsi qu'une estimation de la probabilité de réponse.

Informations sur le modèle

Propriété Description
 : code du modèle models/aqa
 : types de données acceptés

Entrée

Texte

Sortie

Texte

Langue acceptée Anglais
Limites de jeton[*]

Limite de jetons d'entrée

7,168

Limite de jetons de sortie

1 024

Limites de débit[**] 1 500 requêtes par minute
Compatible
Dernière mise à jour Décembre 2023

Consultez les exemples pour découvrir les fonctionnalités de ces variantes de modèle.

[*] Un jeton équivaut à environ quatre caractères pour les modèles Gemini. 100 jetons correspondent à environ 60-80 mots en anglais.

[**] RPM: requêtes par minute
TPM: jetons par minute
RPD: requêtes par jour
TPD: jetons par jour

En raison des limites de capacité, les limites de débit maximales spécifiées ne sont pas garanties.

Modèles de noms de versions de modèle

Les modèles Gemini sont disponibles en versions preview ou stable. Dans votre code, vous pouvez utiliser l'un des formats de nom de modèle suivants pour spécifier le modèle et la version que vous souhaitez utiliser.

  • Dernière:indique la version la plus récente du modèle pour une génération et une variante spécifiées. Le modèle sous-jacent est mis à jour régulièrement et peut s'agir d'une version preview. Seuls les prototypes et les applications de test exploratoire doivent utiliser cet alias.

    Pour spécifier la dernière version, utilisez le format suivant : <model>-<generation>-<variation>-latest. Exemple : gemini-1.0-pro-latest.

  • Dernière version stable:pointe vers la dernière version stable publiée pour la génération et la variation de modèle spécifiées.

    Pour spécifier la dernière version stable, utilisez le format suivant : <model>-<generation>-<variation>. Exemple :gemini-1.0-pro

  • Stable:indique un modèle stable spécifique. Les modèles stables ne changent pas. La plupart des applications de production doivent utiliser un modèle stable spécifique.

    Pour spécifier une version stable, utilisez le format suivant : <model>-<generation>-<variation>-<version>. Exemple : gemini-1.0-pro-001.

  • Expérimental:fait référence à un modèle expérimental disponible en version Preview, comme défini dans les Conditions. Il n'est donc pas destiné à une utilisation en production. Nous publions des modèles expérimentaux pour recueillir des commentaires, mettre rapidement nos dernières nouveautés entre les mains des développeurs et mettre en avant le rythme d'innovation de Google. Ce que nous apprenons des lancements expérimentaux nous aide à déployer les modèles à plus grande échelle. Un modèle expérimental peut être remplacé par un autre sans préavis. Nous ne garantissons pas qu'un modèle expérimental deviendra un modèle stable à l'avenir.

    Pour spécifier une version expérimentale, utilisez le format suivant : <model>-<generation>-<variation>-<version>. Exemple : gemini-1.5-pro-exp-0827.

Langues disponibles

Les modèles Gemini sont entraînés pour fonctionner avec les langues suivantes:

  • Arabe (ar)
  • Bengalî (bn)
  • Bulgare (bg)
  • Chinois simplifié et traditionnel (zh)
  • Croate (hr)
  • République tchèque (cs)
  • Danois (da)
  • Néerlandais (nl)
  • Anglais (en)
  • Estonien (et)
  • Finnois (fi)
  • Français (fr)
  • Allemand (de)
  • Grec (el)
  • Hébreu (iw)
  • Hindi (hi)
  • Hongrois (hu)
  • Indonésien (id)
  • Italien (it)
  • Japonais (ja)
  • Coréen (ko)
  • Letton (lv)
  • Lituanien (lt)
  • Norvégien (no)
  • Polonais (pl)
  • Portugais (pt)
  • Roumain (ro)
  • Russe (ru)
  • Serbe (sr)
  • Slovaque (sk)
  • Slovène (sl)
  • Espagnol (es)
  • Swahili (sw)
  • Suédois (sv)
  • Thaï (th)
  • Turc (tr)
  • Ukrainien (uk)
  • Vietnamien (vi)