Gemini est une famille de modèles d'IA générative qui permet aux développeurs de générer du contenu et de résoudre des problèmes. Ces modèles sont conçus et entraînés pour traiter du texte et des images en entrée. Ce guide fournit des informations sur chaque variante de modèle pour vous aider à déterminer celle qui convient le mieux à votre cas d'utilisation.
Voici un bref récapitulatif des modèles disponibles et de leurs fonctionnalités:
Modèles | Entrée | Résultat |
---|---|---|
Gémeaux | ||
|
Texte et images | Texte |
|
Texte | Texte |
|
Texte et images | Texte |
Représentations vectorielles continues | ||
|
Texte | Représentations vectorielles continues de textes |
Récupération | ||
|
Texte | Texte |
Sécurité et utilisation prévue
Les modèles d'intelligence artificielle générative sont des outils puissants, mais ils ne sont pas sans limites. Leur polyvalence et leur applicabilité peuvent parfois entraîner des résultats inattendus, tels que des résultats imprécis, biaisés ou choquants. Le post-traitement et une évaluation manuelle rigoureuse sont essentiels pour limiter le risque de préjudice généré par de tels résultats. Consultez les conseils de sécurité pour obtenir d'autres suggestions d'utilisation sécurisée.
Les modèles fournis par l'API Gemini peuvent être utilisés pour une grande variété d'applications d'IA générative et de traitement du langage naturel (TLN). L'utilisation de ces fonctions n'est disponible que via l'API Gemini ou l'application Web Google AI Studio. Votre utilisation de l'API Gemini est également soumise au Règlement sur les utilisations interdites de l'IA générative et aux Conditions d'utilisation de l'API Gemini.
Tailles de modèles
Le tableau suivant présente les tailles disponibles et leur signification les unes par rapport aux autres.
Taille du modèle | Description | Services |
---|---|---|
Gemini 1.0 Pro | Taille du modèle qui équilibre la capacité et l'efficacité. |
|
Versions de modèle
Les modèles Gemini sont disponibles en version preview ou stable. Dans votre code, vous pouvez utiliser l'un des formats de nom de modèle suivants pour spécifier le modèle et la version que vous souhaitez utiliser.
Dernière version:pointe vers la version de pointe du modèle pour une génération et une variante spécifiées. Le modèle sous-jacent est mis à jour régulièrement et peut être une version preview. Seuls les tests exploratoires et les prototypes doivent utiliser cet alias.
Pour spécifier la dernière version, utilisez le modèle suivant :
<model>-<generation>-<variation>-latest
. Exemple :gemini-1.0-pro-latest
.Dernière version stable:pointe vers la version stable la plus récente publiée pour la génération et la variante de modèle spécifiées.
Pour spécifier la dernière version stable, utilisez le modèle suivant :
<model>-<generation>-<variation>
. Exemple :gemini-1.0-pro
Stable:pointe vers un modèle stable spécifique. Les modèles stables ne changent pas. La plupart des applications de production doivent utiliser un modèle stable spécifique.
Pour spécifier une version stable, utilisez le modèle suivant :
<model>-<generation>-<variation>-<version>
. Exemple :gemini-1.0-pro-001
.
Pour les modèles disposant d'une version stable, consultez la ligne "Noms des modèles" dans la section Variantes du modèle.
Variantes du modèle
L'API Gemini propose différents modèles optimisés pour des cas d'utilisation spécifiques. Le tableau suivant décrit les attributs de chaque option.
Variation | Attribut | Description |
---|---|---|
Gemini 1.5 Pro (preview uniquement) | Dernière mise à jour du modèle | Avril 2024 |
Code du modèle | models/gemini-1.5-pro-latest |
|
Capacités du modèle |
|
|
Méthodes de génération compatibles | generateContent |
|
Limite de jetons d'entrée | 1048576 | |
Limite de jetons de sortie | 8 192 | |
Sécurité du modèle | Paramètres de sécurité appliqués automatiquement et ajustables par les développeurs Pour en savoir plus, consultez la rubrique Paramètres de sécurité. | |
Limite de débit | 2 requêtes par minute, 1 000 requêtes par jour[1] | |
Gemini Pro | Dernière mise à jour du modèle | February 2024 |
Code du modèle | models/gemini-pro |
|
Capacités du modèle |
|
|
Méthodes de génération compatibles | generateContent |
|
Limite de jetons d'entrée | 30 720 | |
Limite de jetons de sortie | 2 048 | |
Sécurité du modèle | Paramètres de sécurité appliqués automatiquement et ajustables par les développeurs Pour en savoir plus, consultez la rubrique Paramètres de sécurité. | |
Limite de débit | 60 requêtes par minute[1] | |
Noms de modèles |
|
|
Gemini 1.0 Pro Vision | Dernière mise à jour du modèle | Décembre 2023 |
Code du modèle | models/gemini-pro-vision |
|
Capacités du modèle |
|
|
Méthodes de génération compatibles | generateContent |
|
Limite de jetons d'entrée | 12 288 | |
Limite de jetons de sortie | 4 096 | |
Sécurité du modèle | Paramètres de sécurité appliqués automatiquement et ajustables par les développeurs Pour en savoir plus, consultez la rubrique Paramètres de sécurité. | |
Limite de débit | 60 requêtes par minute[1] | |
Représentation vectorielle continue | Dernière mise à jour du modèle | Décembre 2023 |
Code du modèle | models/embedding-001 |
|
Capacités du modèle |
|
|
Méthodes de génération compatibles | embedContent |
|
Sécurité du modèle | Aucun paramètre de sécurité réglable. | |
Limite de débit | 1 500 requêtes par minute[1] | |
Représentation vectorielle continue de texte | Dernière mise à jour du modèle | Avril 2024 |
Code du modèle | models/text-embedding-004 (text-embedding-preview-0409 dans Vertex AI)
|
|
Capacités du modèle |
|
|
Méthodes de génération compatibles | embedContent |
|
Sécurité du modèle | Aucun paramètre de sécurité réglable. | |
Limite de débit | 1 500 requêtes par minute[1] | |
AQA | Dernière mise à jour du modèle | Décembre 2023 |
Code du modèle | models/aqa |
|
Capacités du modèle |
|
|
Méthodes de génération compatibles | generateAnswer |
|
Langues disponibles | Anglais | |
Limite de jetons d'entrée | 7168 | |
Limite de jetons de sortie | 1 024 | |
Sécurité du modèle | Paramètres de sécurité appliqués automatiquement et ajustables par les développeurs Pour en savoir plus, consultez la rubrique Paramètres de sécurité. | |
Limite de débit | 60 requêtes par minute[1] |
Consultez les exemples pour explorer les capacités de ces variantes de modèles.
Métadonnées du modèle
Utilisez l'API ModelService
pour obtenir des métadonnées supplémentaires sur les derniers modèles, telles que les limites des jetons d'entrée et de sortie. Le tableau suivant affiche les métadonnées de la variante de modèle Gemini Pro.
Attribut | Valeur |
---|---|
Nom à afficher | Gemini 1.0 Pro |
Code du modèle | models/gemini-1.0-pro |
Description | Modèle ciblé pour la génération de texte |
Méthodes de génération compatibles | generateContent |
Température | 0.9 |
top_p | 1 |
top_k | 1 |
Attributs du modèle
Le tableau suivant décrit les attributs des modèles Gemini communs à toutes les variantes de modèles.
Attribut | Description |
---|---|
Données d'entraînement | Gemini est la date limite de connaissance pour début 2023. Les informations sur les événements postérieurs à cette date sont limitées. |
Langues disponibles | Voir les langues disponibles |
Paramètres de modèle configurables |
|
[1] En raison des limites de capacité, les limites de débit maximales spécifiées ne sont pas garanties.
Pour en savoir plus sur chacun de ces paramètres, consultez la section Paramètres de modèle du guide de présentation des LLM.
Étapes suivantes
- Pour vous lancer sans code, consultez le guide de démarrage rapide de Google AI Studio.
- Pour commencer à utiliser l'API, consultez le guide de démarrage rapide de Python.