L'Ancrage dans la recherche Google est désormais disponible. En savoir plus

Cette page a été traduite par l'API Cloud Translation.

Modèles Gemini

1.5 Flash

Notre modèle multimodal le plus équilibré, offrant d'excellentes performances pour la plupart des tâches

Saisissez des contenus audio, des images, des vidéos et du texte, et obtenez des réponses textuelles
Générer du code, extraire des données, modifier du texte, etc.
Idéal pour les tâches qui équilibrent performances et coûts

1.5 Flash-8B

Notre modèle multimodal le plus rapide et le plus économique, offrant d'excellentes performances pour les tâches à haute fréquence

Saisissez des contenus audio, des images, des vidéos et du texte, et obtenez des réponses textuelles
Générer du code, extraire des données, modifier du texte, etc.
Idéal pour les tâches à faible intelligence et à haute fréquence

1.5 Pro

Notre modèle multimodal le plus performant, avec des fonctionnalités adaptées à un large éventail de tâches de raisonnement

Saisissez des contenus audio, des images, des vidéos et du texte, et obtenez des réponses textuelles
Générer du code, extraire des données, modifier du texte, etc.
Pour booster vos performances

Variantes du modèle

L'API Gemini propose différents modèles optimisés pour des cas d'utilisation spécifiques. Voici un bref aperçu des variantes de Gemini disponibles:

Variante du modèle	Entrées	Sortie	Optimisé pour
Gemini 1.5 Flash `gemini-1.5-flash`	Audio, images, vidéos et texte	Texte	Performances rapides et polyvalentes pour diverses tâches
Gemini 1.5 Flash-8B `gemini-1.5-flash-8b`	Audio, images, vidéos et texte	Texte	Tâches à fort volume et à faible intelligence
Gemini 1.5 Pro `gemini-1.5-pro`	Audio, images, vidéos et texte	Texte	Tâches de raisonnement complexes nécessitant plus d'intelligence
Gemini 1.0 Pro (obsolète le 15/02/2025) `gemini-1.0-pro`	Texte	Texte	Tâches en langage naturel, chat textuel et de code multitours, et génération de code
Embedding textuel `text-embedding-004`	Texte	Embeddings textuels	Mesurer la similarité entre des chaînes de texte
AQA `aqa`	Texte	Texte	Fournir des réponses aux questions basées sur des sources

Gemini 1.5 Flash

Gemini 1.5 Flash est un modèle multimodal rapide et polyvalent, adapté à un large éventail de tâches.

Essayer dans AI Studio

Informations sur le modèle

Propriété	Description
: code du modèle	`models/gemini-1.5-flash`
: types de données acceptés	Entrées Audio, images, vidéos et texte Sortie Texte
Limites de jeton^[*]	Limite de jetons d'entrée 1 048 576 Limite de jetons de sortie 8 192
Spécifications audio/visuelles	Nombre maximal d'images par requête 3 600 Durée maximale de la vidéo 1 heure Durée audio maximale Environ 9,5 heures
Limites de débit^[**]	Sans frais 15 RPM 1 million de TPM 1 500 RPM Pay-as-you-go: 2 000 RPM 4 millions de TPM
Fonctionnalités de	Instructions système Compatible Mode JSON Compatible Schéma JSON Compatible Paramètres de sécurité ajustables Compatible Mise en cache Compatible Accordage Compatible Appel de fonction Compatible Exécution du code Compatible
Versions	Pour en savoir plus, consultez les modèles de version de modèle. Dernier e-mail : `gemini-1.5-flash-latest` Dernière version stable: `gemini-1.5-flash` Stable: `gemini-1.5-flash-001` `gemini-1.5-flash-002` Expérimental: `gemini-1.5-flash-8b-exp-0924` `gemini-1.5-flash-8b-exp-0827` `gemini-1.5-flash-exp-0827`
Dernière mise à jour	Septembre 2024

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B est un petit modèle conçu pour les tâches d'intelligence de moindre envergure.

Essayer dans AI Studio

Informations sur le modèle

Propriété	Description
: code du modèle	`models/gemini-1.5-flash-8b`
: types de données acceptés	Entrées Audio, images, vidéos et texte Sortie Texte
Limites de jeton^[*]	Limite de jetons d'entrée 1 048 576 Limite de jetons de sortie 8 192
Spécifications audio/visuelles	Nombre maximal d'images par requête 3 600 Durée maximale de la vidéo 1 heure Durée audio maximale Environ 9,5 heures
Limites de débit^[**]	Sans frais 15 RPM 1 million de TPM 1 500 RPM Pay-as-you-go: 4 000 RPM 4 millions de TPM
Fonctionnalités de	Instructions système Compatible Mode JSON Compatible Schéma JSON Compatible Paramètres de sécurité ajustables Compatible Mise en cache Compatible Accordage Compatible Appel de fonction Compatible Exécution du code Compatible
Versions	Pour en savoir plus, consultez les modèles de version de modèle. Dernier e-mail : `gemini-1.5-flash-8b-latest` Dernière version stable: `gemini-1.5-flash-8b` Stable: `gemini-1.5-flash-8b-001`
Dernière mise à jour	Octobre 2024

Gemini 1.5 Pro

Gemini 1.5 Pro est un modèle multimodal de taille moyenne optimisé pour un large éventail de tâches de raisonnement. 1.5 Pro peut traiter de grandes quantités de données à la fois, y compris deux heures de vidéo, 19 heures d'audio, des codebases de 60 000 lignes de code ou 2 000 pages de texte.

Essayer dans AI Studio

Informations sur le modèle

Propriété	Description
: code du modèle	`models/gemini-1.5-pro`
: types de données acceptés	Entrées Audio, images, vidéos et texte Sortie Texte
Limites de jeton^[*]	Limite de jetons d'entrée 2 097 152 Limite de jetons de sortie 8 192
Spécifications audio/visuelles	Nombre maximal d'images par requête 7 200 Durée maximale de la vidéo 2 heures Durée audio maximale Environ 19 heures
Limites de débit^[**]	Sans frais 2 tr/min 32 000 TPM 50 RPD Pay-as-you-go: 1 000 RPM 4 millions de TPM
Fonctionnalités de	Instructions système Compatible Mode JSON Compatible Schéma JSON Compatible Paramètres de sécurité ajustables Compatible Mise en cache Compatible Accordage Not supported Appel de fonction Compatible Exécution du code Compatible
Versions	Pour en savoir plus, consultez les modèles de version de modèle. Dernier e-mail : `gemini-1.5-pro-latest` Dernière version stable: `gemini-1.5-pro` Stable: `gemini-1.5-pro-001` `gemini-1.5-pro-002` Expérimental: `gemini-1.5-pro-exp-0827`
Dernière mise à jour	Septembre 2024

Gemini 1.0 Pro (obsolète)

Gemini 1.0 Pro est un modèle de traitement du langage naturel qui gère des tâches telles que le chat textuel et de code multitour, ainsi que la génération de code.

Essayer dans AI Studio

Informations sur le modèle

Propriété	Description
: code du modèle	`models/gemini-1.0-pro`
: types de données acceptés	Entrée Texte Sortie Texte
Limites de débit^[**]	Sans frais 15 RPM 32 000 TPM 1 500 RPM Pay-as-you-go: 360 tr/min 120 000 TPM 30 000 RPM
Fonctionnalités de	Instructions système Not supported Mode JSON Not supported Schéma JSON Not supported Paramètres de sécurité ajustables Compatible Mise en cache Not supported Accordage Compatible Appel de fonction Compatible Configuration des appels de fonction Not supported Exécution du code Not supported
Versions	Dernier e-mail : `gemini-1.0-pro-latest` Dernière version stable: `gemini-1.0-pro` Stable: `gemini-1.0-pro-001`
Dernière mise à jour	Février 2024

Remarque:gemini-pro est un alias de gemini-1.0-pro.

Embeddings de texte et embeddings

Embedding textuel

Les embeddings de texte sont utilisés pour mesurer la similarité des chaînes et sont largement utilisés dans de nombreuses applications d'IA.

text-embedding-004 offre des meilleures performances de récupération et surpasse les modèles existants avec des dimensions comparables, sur les benchmarks d'encapsulation MTEB standards.

Informations sur le modèle

Propriété	Description
: code du modèle	API Gemini `models/text-embedding-004`
: types de données acceptés	Entrée Texte Sortie Embeddings textuels
Limites de jeton^[*]	Limite de jetons d'entrée 2 048 Taille de la dimension de sortie 768
Limites de débit^[**]	1 500 requêtes par minute
	Not supported
Dernière mise à jour	Avril 2024

Embedding

Vous pouvez utiliser le modèle d'embedding pour générer des embeddings de texte pour le texte d'entrée.

Le modèle d'embedding est optimisé pour créer des embeddings à 768 dimensions pour un texte de 2 048 jetons maximum.

Détails du modèle d'embedding

Propriété	Description
: code du modèle	`models/embedding-001`
: types de données acceptés	Entrée Texte Sortie Embeddings textuels
Limites de jeton^[*]	Limite de jetons d'entrée 2 048 Taille de la dimension de sortie 768
Limites de débit^[**]	1 500 requêtes par minute
	Not supported
Dernière mise à jour	Décembre 2023

AQA

Vous pouvez utiliser le modèle AQA pour effectuer des tâches liées à la résolution de questions attribuée (AQA) sur un document, un corpus ou un ensemble de passages. Le modèle AQA renvoie des réponses aux questions qui sont fondées sur les sources fournies, ainsi qu'une estimation de la probabilité de réponse.

Informations sur le modèle

Propriété	Description
: code du modèle	`models/aqa`
: types de données acceptés	Entrée Texte Sortie Texte
Langue acceptée	Anglais
Limites de jeton^[*]	Limite de jetons d'entrée 7,168 Limite de jetons de sortie 1 024
Limites de débit^[**]	1 500 requêtes par minute
	Compatible
Dernière mise à jour	Décembre 2023

Consultez les exemples pour découvrir les fonctionnalités de ces variantes de modèle.

[*] Un jeton équivaut à environ quatre caractères pour les modèles Gemini. 100 jetons correspondent à environ 60-80 mots en anglais.

[**] RPM: requêtes par minute
TPM: jetons par minute
RPD: requêtes par jour
TPD: jetons par jour

En raison des limites de capacité, les limites de débit maximales spécifiées ne sont pas garanties.

Modèles de noms de versions de modèle

Les modèles Gemini sont disponibles en versions preview ou stable. Dans votre code, vous pouvez utiliser l'un des formats de nom de modèle suivants pour spécifier le modèle et la version que vous souhaitez utiliser.

Dernière:indique la version la plus récente du modèle pour une génération et une variante spécifiées. Le modèle sous-jacent est mis à jour régulièrement et peut s'agir d'une version preview. Seuls les prototypes et les applications de test exploratoire doivent utiliser cet alias.

Pour spécifier la dernière version, utilisez le format suivant : <model>-<generation>-<variation>-latest. Exemple : gemini-1.0-pro-latest.
Dernière version stable:pointe vers la dernière version stable publiée pour la génération et la variation de modèle spécifiées.

Pour spécifier la dernière version stable, utilisez le format suivant : <model>-<generation>-<variation>. Exemple :gemini-1.0-pro
Stable:indique un modèle stable spécifique. Les modèles stables ne changent pas. La plupart des applications de production doivent utiliser un modèle stable spécifique.

Pour spécifier une version stable, utilisez le format suivant : <model>-<generation>-<variation>-<version>. Exemple : gemini-1.0-pro-001.
Expérimental:fait référence à un modèle expérimental disponible en version Preview, comme défini dans les Conditions. Il n'est donc pas destiné à une utilisation en production. Nous publions des modèles expérimentaux pour recueillir des commentaires, mettre rapidement nos dernières nouveautés entre les mains des développeurs et mettre en avant le rythme d'innovation de Google. Ce que nous apprenons des lancements expérimentaux nous aide à déployer les modèles à plus grande échelle. Un modèle expérimental peut être remplacé par un autre sans préavis. Nous ne garantissons pas qu'un modèle expérimental deviendra un modèle stable à l'avenir.

Pour spécifier une version expérimentale, utilisez le format suivant : <model>-<generation>-<variation>-<version>. Exemple : gemini-1.5-pro-exp-0827.

Langues disponibles

Les modèles Gemini sont entraînés pour fonctionner avec les langues suivantes:

Arabe (ar)
Bengalî (bn)
Bulgare (bg)
Chinois simplifié et traditionnel (zh)
Croate (hr)
République tchèque (cs)
Danois (da)
Néerlandais (nl)
Anglais (en)
Estonien (et)
Finnois (fi)
Français (fr)
Allemand (de)
Grec (el)
Hébreu (iw)
Hindi (hi)
Hongrois (hu)
Indonésien (id)
Italien (it)
Japonais (ja)
Coréen (ko)
Letton (lv)
Lituanien (lt)
Norvégien (no)
Polonais (pl)
Portugais (pt)
Roumain (ro)
Russe (ru)
Serbe (sr)
Slovaque (sk)
Slovène (sl)
Espagnol (es)
Swahili (sw)
Suédois (sv)
Thaï (th)
Turc (tr)
Ukrainien (uk)
Vietnamien (vi)