Modèles Gemini

Gemini est une famille de modèles d'IA générative qui permet aux développeurs de générer du contenu et de résoudre des problèmes. Ces modèles sont conçus et entraînés pour traiter du texte et des images en entrée. Ce guide fournit des informations sur chaque variante de modèle pour vous aider à déterminer celle qui convient le mieux à votre cas d'utilisation.

Voici un bref récapitulatif des modèles disponibles et de leurs fonctionnalités:

Modèles Entrée Résultat
Gémeaux
  • Gemini 1.5 Pro (preview uniquement)
Texte et images Texte
  • Gemini 1.0 Pro
Texte Texte
  • Gemini 1.0 Pro Vision
Texte et images Texte
Représentations vectorielles continues
  • Représentation vectorielle continue
Texte Représentations vectorielles continues de textes
Récupération
  • AQA
Texte Texte

Sécurité et utilisation prévue

Les modèles d'intelligence artificielle générative sont des outils puissants, mais ils ne sont pas sans limites. Leur polyvalence et leur applicabilité peuvent parfois entraîner des résultats inattendus, tels que des résultats imprécis, biaisés ou choquants. Le post-traitement et une évaluation manuelle rigoureuse sont essentiels pour limiter le risque de préjudice généré par de tels résultats. Consultez les conseils de sécurité pour obtenir d'autres suggestions d'utilisation sécurisée.

Les modèles fournis par l'API Gemini peuvent être utilisés pour une grande variété d'applications d'IA générative et de traitement du langage naturel (TLN). L'utilisation de ces fonctions n'est disponible que via l'API Gemini ou l'application Web Google AI Studio. Votre utilisation de l'API Gemini est également soumise au Règlement sur les utilisations interdites de l'IA générative et aux Conditions d'utilisation de l'API Gemini.

Tailles de modèles

Le tableau suivant présente les tailles disponibles et leur signification les unes par rapport aux autres.

Taille du modèle Description Services
Gemini 1.0 Pro Taille du modèle qui équilibre la capacité et l'efficacité.
  • text
  • chat

Versions de modèle

Les modèles Gemini sont disponibles en version preview ou stable. Dans votre code, vous pouvez utiliser l'un des formats de nom de modèle suivants pour spécifier le modèle et la version que vous souhaitez utiliser.

  • Dernière version:pointe vers la version de pointe du modèle pour une génération et une variante spécifiées. Le modèle sous-jacent est mis à jour régulièrement et peut être une version preview. Seuls les tests exploratoires et les prototypes doivent utiliser cet alias.

    Pour spécifier la dernière version, utilisez le modèle suivant : <model>-<generation>-<variation>-latest. Exemple : gemini-1.0-pro-latest.

  • Dernière version stable:pointe vers la version stable la plus récente publiée pour la génération et la variante de modèle spécifiées.

    Pour spécifier la dernière version stable, utilisez le modèle suivant : <model>-<generation>-<variation>. Exemple :gemini-1.0-pro

  • Stable:pointe vers un modèle stable spécifique. Les modèles stables ne changent pas. La plupart des applications de production doivent utiliser un modèle stable spécifique.

    Pour spécifier une version stable, utilisez le modèle suivant : <model>-<generation>-<variation>-<version>. Exemple : gemini-1.0-pro-001.

Pour les modèles disposant d'une version stable, consultez la ligne "Noms des modèles" dans la section Variantes du modèle.

Variantes du modèle

L'API Gemini propose différents modèles optimisés pour des cas d'utilisation spécifiques. Le tableau suivant décrit les attributs de chaque option.

Variation Attribut Description
Gemini 1.5 Pro (preview uniquement) Dernière mise à jour du modèle Avril 2024
Code du modèle models/gemini-1.5-pro-latest
Capacités du modèle
  • Entrée: audio, image, texte
  • Sortie: texte
  • Optimisé pour les tâches linguistiques telles que :
    • Génération de code
    • Génération de texte
    • Modification de texte
    • Résolution des problèmes
    • Génération de recommandations
    • Extraction d'informations
    • Extraction ou génération de données
    • Agent IA
  • Peut gérer des tâches de zéro, un et few-shot.
Méthodes de génération compatibles generateContent
Limite de jetons d'entrée 1048576
Limite de jetons de sortie 8 192
Sécurité du modèle Paramètres de sécurité appliqués automatiquement et ajustables par les développeurs Pour en savoir plus, consultez la rubrique Paramètres de sécurité.
Limite de débit 2 requêtes par minute, 1 000 requêtes par jour[1]
Gemini Pro Dernière mise à jour du modèle February 2024
Code du modèle models/gemini-pro
Capacités du modèle
  • Entrée: texte
  • Sortie: texte
  • Génère du texte.
  • Peut gérer le format conversationnel multitours.
  • Peut gérer des tâches de zéro, un et few-shot.
Méthodes de génération compatibles generateContent
Limite de jetons d'entrée 30 720
Limite de jetons de sortie 2 048
Sécurité du modèle Paramètres de sécurité appliqués automatiquement et ajustables par les développeurs Pour en savoir plus, consultez la rubrique Paramètres de sécurité.
Limite de débit 60 requêtes par minute[1]
Noms de modèles
  • Dernière version:gemini-1.0-pro-latest
  • Dernière version stable:gemini-1.0-pro
  • Versions stables:
    • gemini-1.0-pro-001
Gemini 1.0 Pro Vision Dernière mise à jour du modèle Décembre 2023
Code du modèle models/gemini-pro-vision
Capacités du modèle
  • Entrée: texte et images
  • Sortie: texte
  • Peut accepter des entrées multimodales, du texte et des images.
  • Peut gérer des tâches de zéro, un et few-shot.
Méthodes de génération compatibles generateContent
Limite de jetons d'entrée 12 288
Limite de jetons de sortie 4 096
Sécurité du modèle Paramètres de sécurité appliqués automatiquement et ajustables par les développeurs Pour en savoir plus, consultez la rubrique Paramètres de sécurité.
Limite de débit 60 requêtes par minute[1]
Représentation vectorielle continue Dernière mise à jour du modèle Décembre 2023
Code du modèle models/embedding-001
Capacités du modèle
  • Entrée: texte
  • Sortie: texte
  • Génère des représentations vectorielles continues de texte pour le texte d'entrée.
  • Optimisé pour créer des représentations vectorielles continues pour du texte comportant jusqu'à 2 048 jetons.
Méthodes de génération compatibles embedContent
Sécurité du modèle Aucun paramètre de sécurité réglable.
Limite de débit 1 500 requêtes par minute[1]
Représentation vectorielle continue de texte Dernière mise à jour du modèle Avril 2024
Code du modèle models/text-embedding-004 (text-embedding-preview-0409 dans Vertex AI)
Capacités du modèle
  • Entrée: texte
  • Sortie: texte
  • Génère des représentations vectorielles continues de texte pour le texte d'entrée.
  • Compatible avec les tailles de représentations vectorielles continues élastiques inférieures à 768.
Méthodes de génération compatibles embedContent
Sécurité du modèle Aucun paramètre de sécurité réglable.
Limite de débit 1 500 requêtes par minute[1]
AQA Dernière mise à jour du modèle Décembre 2023
Code du modèle models/aqa
Capacités du modèle
  • Entrée: texte
  • Sortie: texte
  • Modèle qui effectue des réponses aux questions attribuées.
  • Modèle entraîné pour renvoyer des réponses aux questions fondées sur les sources fournies, et estimer la probabilité d'une réponse.
Méthodes de génération compatibles generateAnswer
Langues disponibles Anglais
Limite de jetons d'entrée 7168
Limite de jetons de sortie 1 024
Sécurité du modèle Paramètres de sécurité appliqués automatiquement et ajustables par les développeurs Pour en savoir plus, consultez la rubrique Paramètres de sécurité.
Limite de débit 60 requêtes par minute[1]

Consultez les exemples pour explorer les capacités de ces variantes de modèles.

Métadonnées du modèle

Utilisez l'API ModelService pour obtenir des métadonnées supplémentaires sur les derniers modèles, telles que les limites des jetons d'entrée et de sortie. Le tableau suivant affiche les métadonnées de la variante de modèle Gemini Pro.

Attribut Valeur
Nom à afficher Gemini 1.0 Pro
Code du modèle models/gemini-1.0-pro
Description Modèle ciblé pour la génération de texte
Méthodes de génération compatibles generateContent
Température 0.9
top_p 1
top_k 1

Attributs du modèle

Le tableau suivant décrit les attributs des modèles Gemini communs à toutes les variantes de modèles.

Attribut Description
Données d'entraînement Gemini est la date limite de connaissance pour début 2023. Les informations sur les événements postérieurs à cette date sont limitées.
Langues disponibles Voir les langues disponibles
Paramètres de modèle configurables
  • Top P
  • Top k
  • Température
  • Arrêter la séquence
  • Longueur maximale de la sortie
  • Nombre de réponses candidates

[1] En raison des limites de capacité, les limites de débit maximales spécifiées ne sont pas garanties.

Pour en savoir plus sur chacun de ces paramètres, consultez la section Paramètres de modèle du guide de présentation des LLM.

Étapes suivantes