1.5 Flash
Notre modèle multimodal le plus rapide et le plus rentable, avec d'excellentes performances pour les tâches à haute fréquence
- Saisissez de l'audio, des images, des vidéos et du texte, et recevez des réponses textuelles
- Générez du code, extrayez des données, modifiez du texte et plus encore
- Recommandé pour les tâches étroites et à haute fréquence
1.5 pro
Notre modèle multimodal le plus performant avec des caractéristiques pour une grande variété de tâches de raisonnement
- Saisissez de l'audio, des images, des vidéos et du texte, et recevez des réponses textuelles
- Générez du code, extrayez des données, modifiez du texte et plus encore
- Quand vous avez besoin de booster vos performances
Variantes du modèle
L'API Gemini propose différents modèles optimisés pour une utilisation spécifique cas d'utilisation. Voici un aperçu des variantes de Gemini disponibles:
Variante du modèle | Entrée(s) | Sortie | Optimized for |
---|---|---|---|
Gemini 1.5 Pro
gemini-1.5-pro |
Audio, images, vidéos et texte | Texte | Tâches de raisonnement complexes telles que la génération de code et de texte l'édition de texte, la résolution de problèmes, l'extraction et la génération de données |
Gemini 1.5 Flash
gemini-1.5-flash |
Audio, images, vidéos et texte | Texte | Rapidité et polyvalence pour des tâches diverses |
Gemini 1.0 Pro
gemini-1.0-pro |
Texte | Texte | Tâches en langage naturel, chat textuel et de code multitour, et code génération |
(Obsolète) Gemini 1.0 Pro Vision
gemini-pro-vision
|
Images, vidéos et texte | Texte | Les tâches visuelles, comme la génération d'images de descriptions ou d'identification d'objets dans des images |
Représentation vectorielle continue de texte
text-embedding-004 |
Texte | Embeddings textuels | Mesure de la relation entre des chaînes de texte |
AQA
aqa |
Texte | Texte | Fournir des réponses aux questions basées sur la source |
Le tableau suivant décrit les attributs des modèles Gemini qui sont commun à toutes les variantes du modèle:
Attribut | Description |
---|---|
Données d'entraînement | La limite de connaissances de Gemini est fixée à novembre 2023. La connaissance des événements générés après cette période est limitée. |
Langues disponibles | Voir les langues disponibles |
Paramètres de modèle configurables |
|
Reportez-vous aux paramètres du modèle de la section des modèles génératifs pour en savoir plus sur chacun de ces paramètres.
Gemini 1.5 Flash
Gemini 1.5 Flash est un modèle multimodal rapide et polyvalent qui permet de faire évoluer diverses tâches.
Informations sur le modèle
Propriété | Description |
---|---|
Code du modèle | models/gemini-1.5-flash |
Types de données acceptés |
Entrées Audio, images, vidéo et texte Sortie Texte |
[*] | Limites de jetons
Limite de jetons d'entrée 1 048 576 Limite de jetons de sortie 8 192 |
Spécifications audiovisuelles |
Nombre maximal d'images par requête 3 600 Durée maximale de la vidéo 1 heure Durée maximale de la piste audio Environ 9,5 heures |
[**] | Limites de débit
<ph type="x-smartling-placeholder">
|
Aptitudes |
Instructions système Compatible Mode JSON Compatible Schéma JSON Not supported Paramètres de sécurité réglables Compatible Mise en cache Compatible Réglages Not supported Appel de fonction Compatible Configuration de l'appel de fonction Compatible Exécution du code Compatible |
Dernière mise à jour | Mai 2024 |
Gemini 1.5 Pro
Gemini 1.5 Pro est un modèle multimodal de taille moyenne optimisé pour un large éventail de tâches de raisonnement. 1.5 Pro peut traiter de grandes quantités de données en une seule fois, y compris 2 heures de vidéo et 19 heures d'audio, des codebases avec 60 000 lignes de code ou 2 000 pages de texte.
Informations sur le modèle
Propriété | Description |
---|---|
Code du modèle | models/gemini-1.5-pro |
Types de données acceptés |
Entrées Audio, images, vidéo et texte Sortie Texte |
[*] | Limites de jetons
Limite de jetons d'entrée 2 097 152 Limite de jetons de sortie 8 192 |
Spécifications audiovisuelles |
Nombre maximal d'images par requête 7 200 Durée maximale de la vidéo 2 heures Durée maximale de la piste audio Environ 19 heures |
[**] | Limites de débit
<ph type="x-smartling-placeholder">
|
Aptitudes |
Instructions système Compatible Mode JSON Compatible Schéma JSON Compatible Paramètres de sécurité réglables Compatible Mise en cache Compatible Réglages Not supported Appel de fonction Compatible Configuration de l'appel de fonction Compatible Exécution du code Compatible |
Dernière mise à jour | Mai 2024 |
Gemini 1.0 Pro
Gemini 1.0 Pro est un modèle de TLN qui gère des tâches comme le texte multitour le chat de code et la génération de code.
Informations sur le modèle
Propriété | Description |
---|---|
Code du modèle | models/gemini-1.0-pro |
Types de données acceptés |
Entrée Texte Sortie Texte |
[**] | Limites de débit
<ph type="x-smartling-placeholder">
|
Aptitudes |
Instructions système Not supported Mode JSON Not supported Schéma JSON Not supported Paramètres de sécurité réglables Compatible Mise en cache Not supported Réglages Compatible Appel de fonction Compatible Configuration de l'appel de fonction Not supported Exécution du code Not supported |
Dernière mise à jour | Février 2024 |
(Obsolète) Gemini 1.0 Pro Vision
Gemini 1.0 Pro Vision est un modèle multimodal optimisé pour les performances capable d'effectuer des tâches visuelles. Par exemple, la Vision 1.0 Pro générer des descriptions d'images, identifier les objets présents dans les images, fournir des informations sur les lieux ou objets présents dans les images, etc.
Informations sur le modèle
Propriété | Description |
---|---|
Code du modèle | models/gemini-pro-vision |
Types de données acceptés |
Entrées Images, vidéos et texte Sortie Texte |
[*] | Limites de jetons
Limite de jetons d'entrée 12 288 Limite de jetons de sortie 4 096 |
Spécifications audiovisuelles |
Durée maximale de la vidéo 2 minutes |
[**] | Limites de débit60 requêtes par minute |
Aptitudes |
Instructions système Not supported Mode JSON Not supported Schéma JSON Not supported Paramètres de sécurité réglables Compatible Mise en cache Not supported Réglages Not supported Appel de fonction Compatible Configuration de l'appel de fonction Not supported Exécution du code Not supported |
Dernière mise à jour | Décembre 2023 |
Représentation vectorielle continue de texte
Représentation vectorielle continue de texte
Vous pouvez utiliser le modèle de représentation vectorielle continue de texte pour générer représentations vectorielles continues de texte pour texte d'entrée. Pour en savoir plus sur le modèle de représentation vectorielle continue de texte, consultez le Documentation sur l'IA générative sur Vertex AI sur les représentations vectorielles continues de texte.
Le modèle de représentation vectorielle continue de texte est optimisé pour créer des représentations vectorielles continues avec pour du texte comportant jusqu'à 2 048 jetons. L'intégration de texte offre une certaine flexibilité des tailles de représentation vectorielle continue inférieures à 768. Vous pouvez utiliser des représentations vectorielles continues élastiques pour générer des dimensions de sortie réduites et, potentiellement, réduire les coûts de calcul et de stockage. avec une perte de performances mineure.
Informations sur le modèle
Propriété | Description |
---|---|
Code du modèle |
API Gemini
|
Types de données acceptés |
Entrée Texte Sortie Embeddings textuels |
[*] | Limites de jetons
Limite de jetons d'entrée 2 048 Taille de sortie 768 |
[**] | Limites de débit1 500 requêtes par minute |
Paramètres de sécurité ajustables | Not supported |
Dernière mise à jour | Avril 2024 |
Embedding
<ph type="x-smartling-placeholder">Vous pouvez utiliser le modèle de représentation vectorielle continue pour générer représentations vectorielles continues de texte pour texte d'entrée.
Le modèle de représentation vectorielle continue est optimisé pour créer des représentations vectorielles continues de 768 dimensions pour le texte comportant jusqu'à 2 048 jetons.
Détails du modèle de représentation vectorielle continue
Propriété | Description |
---|---|
Code du modèle |
models/embedding-001
|
Types de données acceptés |
Entrée Texte Sortie Embeddings textuels |
[*] | Limites de jetons
Limite de jetons d'entrée 2 048 Taille de sortie 768 |
[**] | Limites de débit1 500 requêtes par minute |
Paramètres de sécurité ajustables | Not supported |
Dernière mise à jour | Décembre 2023 |
AQA
Vous pouvez utiliser le modèle AQA Réponses aux questions attribuées (AQA) sur un document, un corpus ou un ensemble de passages. L'AQA renvoie des réponses à des questions fondées sur des sources fournies, ainsi que l'estimation de la probabilité avec réponse.
Informations sur le modèle
Propriété | Description |
---|---|
Code du modèle | models/aqa |
Types de données acceptés |
Entrée Texte Sortie Texte |
Langue acceptée | Anglais |
[*] | Limites de jetons
Limite de jetons d'entrée 7,168 Limite de jetons de sortie 1 024 |
[**] | Limites de débit1 500 requêtes par minute |
Paramètres de sécurité ajustables | Compatible |
Dernière mise à jour | Décembre 2023 |
Consultez les exemples pour explorer les capacités de ces modèles. variantes.
[*] Un jeton équivaut à environ quatre caractères pour les modèles Gemini. 100 jetons sont environ 60 à 80 mots anglais.
[**] RPM: requêtes par minute
TPM: jetons par minute
RPD: requêtes par jour
TPD: jetons par jour
En raison des limitations de capacité, les limites de débit maximales spécifiées ne sont pas
sont garantis.
Modèles de nom de version de modèle
Les modèles Gemini sont disponibles en versions preview ou stable. Dans votre vous pouvez utiliser l'un des formats de nom de modèle suivants pour spécifier le modèle et la version que vous souhaitez utiliser.
La plus récente:pointe vers la version de pointe du modèle pour un de génération et de variation. Le modèle sous-jacent est mis à jour régulièrement en tant que version preview. Seuls les prototypes et applications de test exploratoires utiliser cet alias.
Pour spécifier la dernière version, utilisez le format suivant:
<model>-<generation>-<variation>-latest
Exemple :gemini-1.0-pro-latest
.Dernière version stable:indique la version stable la plus récente disponible pour le la génération et la variation spécifiées du modèle.
Pour spécifier la dernière version stable, utilisez le modèle suivant:
<model>-<generation>-<variation>
Exemple :gemini-1.0-pro
Stable:pointe vers un modèle stable spécifique. Les modèles stables ne changent pas. La plupart des applications de production doivent utiliser un modèle stable spécifique.
Pour spécifier une version stable, utilisez le modèle suivant:
<model>-<generation>-<variation>-<version>
Exemple :gemini-1.0-pro-001
.
Langues disponibles
Les modèles Gemini sont entraînés pour fonctionner avec les langues suivantes:
- Arabe (
ar
) - Bengalî (
bn
) - Bulgare (
bg
) - Chinois simplifié et traditionnel (
zh
) - Croate (
hr
) - République tchèque (
cs
) - Danois (
da
) - Néerlandais (
nl
) - Anglais (
en
) - Estonien (
et
) - Finnois (
fi
) - Français (
fr
) - Allemand (
de
) - Grec (
el
) - Hébreu (
iw
) - Hindi (
hi
) - Hongrois (
hu
) - Indonésien (
id
) - Italien (
it
) - Japonais (
ja
) - Coréen (
ko
) - Letton (
lv
) - Lituanien (
lt
) - Norvégien (
no
) - Polonais (
pl
) - Portugais (
pt
) - Roumain (
ro
) - Russe (
ru
) - Serbe (
sr
) - Slovaque (
sk
) - Slovène (
sl
) - Espagnol (
es
) - Swahili (
sw
) - Suédois (
sv
) - Thaï (
th
) - Turc (
tr
) - Ukrainien (
uk
) - Vietnamien (
vi
)