Modèles Gemini

Variantes du modèle

L'API Gemini propose différents modèles optimisés pour une utilisation spécifique cas d'utilisation. Voici un aperçu des variantes de Gemini disponibles:

Variante du modèle Entrée(s) Sortie Optimized for
Gemini 1.5 Flash gemini-1.5-flash
Audio, images, vidéos et texte Texte Rapidité et polyvalence pour des tâches diverses
Gemini 1.5 Pro gemini-1.5-pro
Audio, images, vidéos et texte Texte Tâches de raisonnement complexes telles que la génération de code et de texte l'édition de texte, la résolution de problèmes, l'extraction et la génération de données
Gemini 1.0 Pro gemini-1.0-pro
Texte Texte Tâches en langage naturel, chat textuel et de code multitour, et code génération
Intégration de texte text-embedding-004
Texte Embeddings textuels Mesure de la relation entre des chaînes de texte
AQA aqa
Texte Texte Fournir des réponses aux questions basées sur la source

Le tableau suivant décrit les attributs des modèles Gemini qui sont commun à toutes les variantes du modèle:

Attribut Description
Données d'entraînement La limite de connaissances de Gemini est fixée à novembre 2023. La connaissance des événements générés après cette période est limitée.
Langues disponibles Voir les langues disponibles
Paramètres de modèle configurables
  • Top P
  • Top K
  • Température
  • Arrêter la séquence
  • Longueur maximale de sortie
  • Nombre de réponses candidates

Reportez-vous aux paramètres du modèle de la section des modèles génératifs pour en savoir plus sur chacun de ces paramètres.

Gemini 1.5 Flash

Gemini 1.5 Flash est un modèle multimodal rapide et polyvalent qui permet de faire évoluer diverses tâches.

Essayer dans AI Studio

Informations sur le modèle

Propriété Description
Code du modèle models/gemini-1.5-flash
Types de données acceptés

Entrées

Audio, images, vidéo et texte

Sortie

Texte

Limites de jetons[*]

Limite de jetons d'entrée

1 048 576

Limite de jetons de sortie

8 192

Spécifications audiovisuelles

Nombre maximal d'images par requête

3 600

Durée maximale de la vidéo

1 heure

Durée maximale de la piste audio

Environ 9,5 heures

Limites de débit[**] <ph type="x-smartling-placeholder">
</ph> Sans frais: <ph type="x-smartling-placeholder">
    </ph>
  • 15 tr/min
  • 1 million de TPM
  • 1 500 RPD
<ph type="x-smartling-placeholder">
</ph> Pay-as-you-go:
  • 1 000 tr/min
  • 4 millions de TPM
Capabilities

Instructions système

Compatible

Mode JSON

Compatible

Schéma JSON

Compatible

Paramètres de sécurité réglables

Compatible

Mise en cache

Compatible

Réglages

Compatible

Appel de fonction

Compatible

Configuration de l'appel de fonction

Compatible

Exécution du code

Compatible

Versions
  • Dernier e-mail : gemini-1.5-flash-latest
  • Dernière version stable: gemini-1.5-flash
  • Version stable: gemini-1.5-flash-001
  • Expérimental:
    • gemini-1.5-flash-exp-0827
    • gemini-1.5-flash-8b-exp-0827
Dernière mise à jour Mai 2024

Gemini 1.5 Pro

Gemini 1.5 Pro est un modèle multimodal de taille moyenne optimisé pour un large éventail de tâches de raisonnement. 1.5 Pro peut traiter de grandes quantités de données en une seule fois, y compris 2 heures de vidéo et 19 heures d'audio, des codebases avec 60 000 lignes de code ou 2 000 pages de texte.

Essayer dans AI Studio

Informations sur le modèle

Propriété Description
Code du modèle models/gemini-1.5-pro
Types de données acceptés

Entrées

Audio, images, vidéo et texte

Sortie

Texte

Limites de jetons[*]

Limite de jetons d'entrée

2 097 152

Limite de jetons de sortie

8 192

Spécifications audiovisuelles

Nombre maximal d'images par requête

7 200

Durée maximale de la vidéo

2 heures

Durée maximale de la piste audio

Environ 19 heures

Limites de débit[**] <ph type="x-smartling-placeholder">
</ph> Sans frais: <ph type="x-smartling-placeholder">
    </ph>
  • 2 tr/min
  • 32 000 TPM
  • 50 RPD
<ph type="x-smartling-placeholder">
</ph> Pay-as-you-go:
  • 360 tr/min
  • 4 millions de TPM
Capabilities

Instructions système

Compatible

Mode JSON

Compatible

Schéma JSON

Compatible

Paramètres de sécurité réglables

Compatible

Mise en cache

Compatible

Réglages

Not supported

Appel de fonction

Compatible

Configuration de l'appel de fonction

Compatible

Exécution du code

Compatible

Versions
  • Dernier e-mail : gemini-1.5-pro-latest
  • Dernière version stable: gemini-1.5-pro
  • Version stable: gemini-1.5-pro-001
  • Expérimental:
    • gemini-1.5-pro-exp-0801
    • gemini-1.5-pro-exp-0827
Dernière mise à jour Mai 2024

Gemini 1.0 Pro

Gemini 1.0 Pro est un modèle de TLN qui gère des tâches comme le texte multitour le chat de code et la génération de code.

Essayer dans AI Studio

Informations sur le modèle

Propriété Description
Code du modèle models/gemini-1.0-pro
Types de données acceptés

Entrée

Texte

Sortie

Texte

Limites de débit[**] <ph type="x-smartling-placeholder">
</ph> Sans frais: <ph type="x-smartling-placeholder">
    </ph>
  • 15 tr/min
  • 32 000 TPM
  • 1 500 RPD
<ph type="x-smartling-placeholder">
</ph> Pay-as-you-go:
  • 360 tr/min
  • 120 000 TPM
  • 30 000 RPD
Capabilities

Instructions système

Not supported

Mode JSON

Not supported

Schéma JSON

Not supported

Paramètres de sécurité réglables

Compatible

Mise en cache

Not supported

Réglages

Compatible

Appel de fonction

Compatible

Configuration de l'appel de fonction

Not supported

Exécution du code

Not supported

Versions
  • Dernier e-mail : gemini-1.0-pro-latest
  • Dernière version stable: gemini-1.0-pro
  • Version stable: gemini-1.0-pro-001
Dernière mise à jour Février 2024
<ph type="x-smartling-placeholder">

Représentation vectorielle continue de texte

Représentation vectorielle continue de texte

Les représentations vectorielles continues de texte permettent de mesurer la relation entre les chaînes et sont largement utilisées de nombreuses applications d'IA.

text-embedding-004 améliore les performances de récupération et surpasse les modèles existants avec des dimensions comparables, sur les benchmarks de représentation vectorielle continue MTEB standard.

Informations sur le modèle
Propriété Description
Code du modèle

API Gemini

models/text-embedding-004

Types de données acceptés

Entrée

Texte

Sortie

Embeddings textuels

Limites de jetons[*]

Limite de jetons d'entrée

2 048

Taille de sortie

768

Limites de débit[**] 1 500 requêtes par minute
Paramètres de sécurité ajustables Not supported
Dernière mise à jour Avril 2024

Embedding

<ph type="x-smartling-placeholder">

Vous pouvez utiliser le modèle de représentation vectorielle continue pour générer représentations vectorielles continues de texte pour texte d'entrée.

Le modèle de représentation vectorielle continue est optimisé pour créer des représentations vectorielles continues de 768 dimensions pour le texte comportant jusqu'à 2 048 jetons.

Détails du modèle de représentation vectorielle continue
Propriété Description
Code du modèle models/embedding-001
Types de données acceptés

Entrée

Texte

Sortie

Embeddings textuels

Limites de jetons[*]

Limite de jetons d'entrée

2 048

Taille de sortie

768

Limites de débit[**] 1 500 requêtes par minute
Paramètres de sécurité ajustables Not supported
Dernière mise à jour Décembre 2023

AQA

Vous pouvez utiliser le modèle AQA Réponses aux questions attribuées (AQA) sur un document, un corpus ou un ensemble de passages. L'AQA renvoie des réponses à des questions fondées sur des sources fournies, ainsi que l'estimation de la probabilité avec réponse.

Informations sur le modèle

Propriété Description
Code du modèle models/aqa
Types de données acceptés

Entrée

Texte

Sortie

Texte

Langue acceptée Anglais
Limites de jetons[*]

Limite de jetons d'entrée

7,168

Limite de jetons de sortie

1 024

Limites de débit[**] 1 500 requêtes par minute
Paramètres de sécurité ajustables Compatible
Dernière mise à jour Décembre 2023

Consultez les exemples pour explorer les capacités de ces modèles. variantes.

[*] Un jeton équivaut à environ quatre caractères pour les modèles Gemini. 100 jetons sont environ 60 à 80 mots anglais.

[**] RPM: requêtes par minute
TPM: jetons par minute
RPD: requêtes par jour
TPD: jetons par jour

En raison des limitations de capacité, les limites de débit maximales spécifiées ne sont pas sont garantis.

Modèles de nom de version de modèle

Les modèles Gemini sont disponibles en versions preview ou stable. Dans votre vous pouvez utiliser l'un des formats de nom de modèle suivants pour spécifier le modèle et la version que vous souhaitez utiliser.

  • La plus récente:pointe vers la version de pointe du modèle pour un de génération et de variation. Le modèle sous-jacent est mis à jour régulièrement en tant que version preview. Seuls les prototypes et applications de test exploratoires utiliser cet alias.

    Pour spécifier la dernière version, utilisez le format suivant: <model>-<generation>-<variation>-latest Exemple : gemini-1.0-pro-latest.

  • Dernière version stable:indique la version stable la plus récente disponible pour le la génération et la variation spécifiées du modèle.

    Pour spécifier la dernière version stable, utilisez le modèle suivant: <model>-<generation>-<variation> Exemple :gemini-1.0-pro

  • Stable:pointe vers un modèle stable spécifique. Les modèles stables ne changent pas. La plupart des applications de production doivent utiliser un modèle stable spécifique.

    Pour spécifier une version stable, utilisez le modèle suivant: <model>-<generation>-<variation>-<version> Exemple : gemini-1.0-pro-001.

  • Expérimental:renvoie vers un modèle expérimental disponible en version preview, tel que défini dans les Conditions d'utilisation, ce qui signifie qu'il n'est pas destiné à une utilisation en production. Nous lançons des modèles expérimentaux pour recueillir des commentaires, mettre nos dernières informations à la disposition des développeurs rapidement et souligner le rythme des innovations chez Google. Quoi nous tirons des enseignements des lancements expérimentaux largement. Un modèle expérimental peut être remplacé par un autre sans avis. Nous ne pouvons pas garantir qu'un modèle expérimental deviendra un un modèle stable à l'avenir.

    Pour spécifier une version expérimentale, utilisez le format suivant: <model>-<generation>-<variation>-<version> Exemple : gemini-1.5-pro-exp-0801.

Langues disponibles

Les modèles Gemini sont entraînés pour fonctionner avec les langages suivants:

  • Arabe (ar)
  • Bengalî (bn)
  • Bulgare (bg)
  • Chinois simplifié et traditionnel (zh)
  • Croate (hr)
  • République tchèque (cs)
  • Danois (da)
  • Néerlandais (nl)
  • Anglais (en)
  • Estonien (et)
  • Finnois (fi)
  • Français (fr)
  • Allemand (de)
  • Grec (el)
  • Hébreu (iw)
  • Hindi (hi)
  • Hongrois (hu)
  • Indonésien (id)
  • Italien (it)
  • Japonais (ja)
  • Coréen (ko)
  • Letton (lv)
  • Lituanien (lt)
  • Norvégien (no)
  • Polonais (pl)
  • Portugais (pt)
  • Roumain (ro)
  • Russe (ru)
  • Serbe (sr)
  • Slovaque (sk)
  • Slovène (sl)
  • Espagnol (es)
  • Swahili (sw)
  • Suédois (sv)
  • Thaï (th)
  • Turc (tr)
  • Ukrainien (uk)
  • Vietnamien (vi)