Modèles Gemini

Variantes du modèle

L'API Gemini propose différents modèles optimisés pour des cas d'utilisation spécifiques. Voici un bref aperçu des variantes de Gemini disponibles:

Variante du modèle Entrées Sortie Optimisé pour
Gemini 2.0 Flash
gemini-2.0-flash
Audio, images, vidéos et texte Texte, images (version expérimentale) et audio (bientôt disponible) Fonctionnalités de nouvelle génération, vitesse, réflexion, streaming en temps réel et génération multimodale
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite
Audio, images, vidéos et texte Texte Un modèle Gemini 2.0 Flash optimisé pour la rentabilité et la faible latence
Gemini 2.0 Pro Experimental
gemini-2.0-pro-exp-02-05
Audio, images, vidéos et texte Texte Notre modèle Gemini 2.0 le plus puissant
Gemini 1.5 Flash
gemini-1.5-flash
Audio, images, vidéos et texte Texte Performances rapides et polyvalentes pour diverses tâches
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
Audio, images, vidéos et texte Texte Tâches à fort volume et à faible intelligence
Gemini 1.5 Pro
gemini-1.5-pro
Audio, images, vidéos et texte Texte Tâches de raisonnement complexes nécessitant plus d'intelligence
Embedding Gemini
gemini-embedding-exp
Texte Embeddings textuels Mesurer la relation entre des chaînes de texte
Image 3
imagen-3.0-generate-002
Texte Images Notre modèle de génération d'images le plus avancé

Vous pouvez consulter les limites de débit pour chaque modèle sur la page des limites de débit.

Gemini 2.0 Flash offre des fonctionnalités de nouvelle génération et des fonctionnalités améliorées, y compris une vitesse supérieure, l'utilisation d'outils natifs, la génération multimodale et une fenêtre de contexte d'un million de jetons.

Essayer dans Google AI Studio

Informations sur le modèle

Propriété Description
 : code du modèle models/gemini-2.0-flash
Types de données acceptés

Entrées

Audio, images, vidéos et texte

Sortie

Texte, images (version expérimentale) et audio(bientôt disponible)

Limites de jeton[*]

Limite de jetons d'entrée

1 048 576

Limite de jetons de sortie

8 192

Fonctionnalités de

Sorties structurées

Compatible

Mise en cache

Bientôt disponible

Accordage

Not supported

Appel de fonction

Compatible

Exécution du code

Compatible

Rechercher

Compatible

Génération d'images

Expérimental

Utilisation d'un outil natif

Compatible

Génération audio

Bientôt disponible

API Multimodal Live

Expérimental

Réfléchir

Expérimental

Versions
Pour en savoir plus, consultez les modèles de version de modèle.
  • Dernier e-mail : gemini-2.0-flash
  • Stable: gemini-2.0-flash-001
  • Version expérimentale: gemini-2.0-flash-exp
  • Version expérimentale: gemini-2.0-flash-thinking-exp-01-21
Dernière mise à jour Février 2025
Seuil de connaissance Août 2024

Gemini 2.0 Pro est notre modèle Gemini de deuxième génération le plus puissant, avec un raisonnement puissant, l'utilisation d'outils natifs et une fenêtre de contexte de deux millions de jetons.

Essayer dans Google AI Studio

Informations sur le modèle

Propriété Description
 : code du modèle gemini-2.0-pro-exp-02-05
Types de données acceptés

Entrées

Audio, images, vidéos et texte

Sortie

Texte

Limites de jeton[*]

Limite de jetons d'entrée

2 048 576

Limite de jetons de sortie

8 192

Fonctionnalités de

Sorties structurées

Compatible

Mise en cache

Not supported

Accordage

Not supported

Appel de fonction

Compatible

Exécution du code

Compatible

Rechercher

Compatible

Génération d'images

Not supported

Utilisation d'un outil natif

Compatible

Génération audio

Not supported

API Multimodal Live

Not supported

Versions
Pour en savoir plus, consultez les modèles de version de modèle.
  • Version expérimentale: gemini-2.0-pro-exp-02-05
  • Version expérimentale: gemini-2.0-pro-exp
Dernière mise à jour Février 2025
Seuil de connaissance Août 2024

Modèle Gemini 2.0 Flash optimisé pour la rentabilité et la faible latence.

Essayer dans Google AI Studio

Informations sur le modèle

Propriété Description
 : code du modèle models/gemini-2.0-flash-lite
Types de données acceptés

Entrées

Audio, images, vidéos et texte

Sortie

Texte

Limites de jeton[*]

Limite de jetons d'entrée

1 048 576

Limite de jetons de sortie

8 192

Fonctionnalités de

Sorties structurées

Compatible

Mise en cache

Not supported

Accordage

Not supported

Appel de fonction

Not supported

Exécution du code

Not supported

Rechercher

Not supported

Génération d'images

Not supported

Utilisation d'un outil natif

Not supported

Génération audio

Not supported

API Multimodal Live

Not supported

Versions
Pour en savoir plus, consultez les modèles de version de modèle.
  • Dernier e-mail : gemini-2.0-flash-lite
  • Stable: gemini-2.0-flash-lite-001
Dernière mise à jour Février 2025
Seuil de connaissance Août 2024

Gemini 1.5 Flash est un modèle multimodal rapide et polyvalent, adapté à la mise à l'échelle de diverses tâches.

Essayer dans Google AI Studio

Informations sur le modèle

Propriété Description
 : code du modèle models/gemini-1.5-flash
Types de données acceptés

Entrées

Audio, images, vidéos et texte

Sortie

Texte

Limites de jeton[*]

Limite de jetons d'entrée

1 048 576

Limite de jetons de sortie

8 192

Spécifications audio/visuelles

Nombre maximal d'images par requête

3 600

Durée maximale de la vidéo

1 heure

Durée audio maximale

Environ 9,5 heures

Fonctionnalités de

Instructions système

Compatible

Mode JSON

Compatible

Schéma JSON

Compatible

Paramètres de sécurité ajustables

Compatible

Mise en cache

Compatible

Accordage

Compatible

Appel de fonction

Compatible

Exécution du code

Compatible

Streaming bidirectionnel

Not supported

Versions
Pour en savoir plus, consultez les modèles de version de modèle.
  • Dernier e-mail : gemini-1.5-flash-latest
  • Dernière version stable: gemini-1.5-flash
  • Stable:
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
Dernière mise à jour Septembre 2024

Gemini 1.5 Flash-8B est un petit modèle conçu pour les tâches d'intelligence de moindre envergure.

Essayer dans Google AI Studio

Informations sur le modèle

Propriété Description
 : code du modèle models/gemini-1.5-flash-8b
Types de données acceptés

Entrées

Audio, images, vidéos et texte

Sortie

Texte

Limites de jeton[*]

Limite de jetons d'entrée

1 048 576

Limite de jetons de sortie

8 192

Spécifications audio/visuelles

Nombre maximal d'images par requête

3 600

Durée maximale de la vidéo

1 heure

Durée audio maximale

Environ 9,5 heures

Fonctionnalités de

Instructions système

Compatible

Mode JSON

Compatible

Schéma JSON

Compatible

Paramètres de sécurité ajustables

Compatible

Mise en cache

Compatible

Accordage

Compatible

Appel de fonction

Compatible

Exécution du code

Compatible

Streaming bidirectionnel

Not supported

Versions
Pour en savoir plus, consultez les modèles de version de modèle.
  • Dernier e-mail : gemini-1.5-flash-8b-latest
  • Dernière version stable: gemini-1.5-flash-8b
  • Stable:
    • gemini-1.5-flash-8b-001
Dernière mise à jour Octobre 2024

Essayez Gemini 2.0 Pro Experimental, notre modèle Gemini le plus avancé à ce jour.

Gemini 1.5 Pro est un modèle multimodal de taille moyenne optimisé pour un large éventail de tâches de raisonnement. 1.5 Pro peut traiter de grandes quantités de données à la fois, y compris deux heures de vidéo, 19 heures d'audio, des codebases de 60 000 lignes de code ou 2 000 pages de texte.

Essayer dans Google AI Studio

Informations sur le modèle

Propriété Description
 : code du modèle models/gemini-1.5-pro
Types de données acceptés

Entrées

Audio, images, vidéos et texte

Sortie

Texte

Limites de jeton[*]

Limite de jetons d'entrée

2 097 152

Limite de jetons de sortie

8 192

Spécifications audio/visuelles

Nombre maximal d'images par requête

7 200

Durée maximale de la vidéo

2 heures

Durée audio maximale

Environ 19 heures

Fonctionnalités de

Instructions système

Compatible

Mode JSON

Compatible

Schéma JSON

Compatible

Paramètres de sécurité ajustables

Compatible

Mise en cache

Compatible

Accordage

Not supported

Appel de fonction

Compatible

Exécution du code

Compatible

Streaming bidirectionnel

Not supported

Versions
Pour en savoir plus, consultez les modèles de version de modèle.
  • Dernier e-mail : gemini-1.5-pro-latest
  • Dernière version stable: gemini-1.5-pro
  • Stable:
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
Dernière mise à jour Septembre 2024

Imagen 3 est notre modèle texte-vers-image le plus performant. Il est capable de générer des images avec encore plus de détails, une meilleure luminosité et moins d'artefacts gênants que nos modèles précédents.

Informations sur le modèle
Propriété Description
 : code du modèle

API Gemini

imagen-3.0-generate-002

Types de données acceptés

Entrée

Texte

Sortie

Images

Limites de jeton[*]

Limite de jetons d'entrée

N/A

Images de sortie

Jusqu'à 4

Dernière mise à jour Février 2025

Gemini embedding offre des performances de pointe dans de nombreuses dimensions clés, y compris le code, le multilinguisme et la récupération.

Informations sur le modèle
Propriété Description
 : code du modèle

API Gemini

gemini-embedding-exp-03-07

Types de données acceptés

Entrée

Texte

Sortie

Embeddings textuels

Limites de jeton[*]

Limite de jetons d'entrée

8 192

Taille de la dimension de sortie

Élastique, compatible avec: 3 072, 1 536 ou 768

Dernière mise à jour Mars 2025

Embedding textuel

Essayez notre nouveau modèle expérimental d'encapsulation Gemini, qui offre des performances de pointe.

Les embeddings de texte sont utilisés pour mesurer la relation entre les chaînes et sont largement utilisés dans de nombreuses applications d'IA.

text-embedding-004 offre des meilleures performances de récupération et surpasse les modèles existants avec des dimensions comparables, sur les benchmarks d'encapsulation MTEB standards.

Informations sur le modèle
Propriété Description
 : code du modèle

API Gemini

models/text-embedding-004

Types de données acceptés

Entrée

Texte

Sortie

Embeddings textuels

Limites de jeton[*]

Limite de jetons d'entrée

2 048

Taille de la dimension de sortie

768

Limites de débit[**] 1 500 requêtes par minute
Not supported
Dernière mise à jour Avril 2024

Embedding

Vous pouvez utiliser le modèle d'embedding pour générer des embeddings de texte pour le texte d'entrée.

Le modèle d'embedding est optimisé pour créer des embeddings à 768 dimensions pour un texte de 2 048 jetons maximum.

Détails du modèle d'embedding
Propriété Description
 : code du modèle models/embedding-001
Types de données acceptés

Entrée

Texte

Sortie

Embeddings textuels

Limites de jeton[*]

Limite de jetons d'entrée

2 048

Taille de la dimension de sortie

768

Limites de débit[**] 1 500 requêtes par minute
Not supported
Dernière mise à jour Décembre 2023

Vous pouvez utiliser le modèle AQA pour effectuer des tâches liées à la résolution de questions attribuée (AQA) sur un document, un corpus ou un ensemble de passages. Le modèle AQA renvoie des réponses aux questions basées sur les sources fournies, ainsi qu'une estimation de la probabilité de réponse.

Informations sur le modèle

Propriété Description
 : code du modèle models/aqa
Types de données acceptés

Entrée

Texte

Sortie

Texte

Langue acceptée Anglais
Limites de jeton[*]

Limite de jetons d'entrée

7,168

Limite de jetons de sortie

1 024

Limites de débit[**] 1 500 requêtes par minute
Compatible
Dernière mise à jour Décembre 2023

Consultez les exemples pour découvrir les fonctionnalités de ces variantes de modèle.

[*] Un jeton équivaut à environ quatre caractères pour les modèles Gemini. 100 jetons correspondent à environ 60-80 mots en anglais.

Modèles de nom de version de modèle

Les modèles Gemini sont disponibles en versions preview ou stable. Dans votre code, vous pouvez utiliser l'un des formats de nom de modèle suivants pour spécifier le modèle et la version que vous souhaitez utiliser.

  • Dernière:indique la version la plus récente du modèle pour une génération et une variante spécifiées. Le modèle sous-jacent est mis à jour régulièrement et peut s'agir d'une version Preview. Seuls les prototypes et les applications de test exploratoire doivent utiliser cet alias.

    Pour spécifier la dernière version, utilisez le format suivant : <model>-<generation>-<variation>-latest. Exemple : gemini-1.0-pro-latest.

  • Dernière version stable:pointe vers la dernière version stable publiée pour la génération et la variation de modèle spécifiées.

    Pour spécifier la dernière version stable, utilisez le format suivant : <model>-<generation>-<variation>. Exemple :gemini-1.0-pro

  • Stable:indique un modèle stable spécifique. Les modèles stables ne changent généralement pas. La plupart des applications de production doivent utiliser un modèle stable spécifique.

    Pour spécifier une version stable, utilisez le format suivant : <model>-<generation>-<variation>-<version>. Exemple : gemini-1.0-pro-001.

  • Expérimental:indique un modèle expérimental (non destiné à une utilisation en production). Nous publions des modèles expérimentaux pour recueillir des commentaires, mettre rapidement nos dernières mises à jour entre les mains des développeurs et mettre en avant le rythme d'innovation de Google.

    Pour spécifier une version expérimentale, utilisez le format suivant : <model>-<generation>-<variation>-<version>. Exemple : gemini-2.0-pro-exp-02-05.

Modèles expérimentaux

En plus des modèles prêts à la production, l'API Gemini propose des modèles expérimentaux (non destinés à un usage en production, comme défini dans nos Conditions).

Nous publions des modèles expérimentaux pour recueillir des commentaires, mettre rapidement nos dernières mises à jour entre les mains des développeurs et mettre en avant le rythme d'innovation de Google. Les enseignements que nous tirons des lancements expérimentaux déterminent la façon dont nous déployons plus largement les modèles. Un modèle expérimental peut être remplacé par un autre sans préavis. Nous ne garantissons pas qu'un modèle expérimental deviendra un modèle stable à l'avenir.

Modèles expérimentaux précédents

Lorsque de nouvelles versions ou versions stables sont disponibles, nous supprimons et remplaçons les modèles expérimentaux. Vous trouverez les modèles expérimentaux précédents que nous avons publiés dans la section suivante, ainsi que la version de remplacement:

Code du modèle Modèle de base Version de remplacement
gemini-2.0-flash-exp Gemini 2.0 Flash gemini-2.0-flash
gemini-exp-1206 Gemini 2.0 Pro gemini-2.0-pro-exp-02-05
gemini-2.0-flash-thinking-exp-1219 Gemini 2.0 Flash Thinking gemini-2.0-flash-thinking-exp-01-21
gemini-exp-1121 Gemini gemini-exp-1206
gemini-exp-1114 Gemini gemini-exp-1206
gemini-1.5-pro-exp-0827 Gemini 1.5 Pro gemini-exp-1206
gemini-1.5-pro-exp-0801 Gemini 1.5 Pro gemini-exp-1206
gemini-1.5-flash-8b-exp-0924 Gemini 1.5 Flash-8B gemini-1.5-flash-8b
gemini-1.5-flash-8b-exp-0827 Gemini 1.5 Flash-8B gemini-1.5-flash-8b

Langues disponibles

Les modèles Gemini sont entraînés pour fonctionner avec les langues suivantes:

  • Arabe (ar)
  • Bengalî (bn)
  • Bulgare (bg)
  • Chinois simplifié et traditionnel (zh)
  • Croate (hr)
  • République tchèque (cs)
  • Danois (da)
  • Néerlandais (nl)
  • Anglais (en)
  • Estonien (et)
  • Finnois (fi)
  • Français (fr)
  • Allemand (de)
  • Grec (el)
  • Hébreu (iw)
  • Hindi (hi)
  • Hongrois (hu)
  • Indonésien (id)
  • Italien (it)
  • Japonais (ja)
  • Coréen (ko)
  • Letton (lv)
  • Lituanien (lt)
  • Norvégien (no)
  • Polonais (pl)
  • Portugais (pt)
  • Roumain (ro)
  • Russe (ru)
  • Serbe (sr)
  • Slovaque (sk)
  • Slovène (sl)
  • Espagnol (es)
  • Swahili (sw)
  • Suédois (sv)
  • Thaï (th)
  • Turc (tr)
  • Ukrainien (uk)
  • Vietnamien (vi)