Un prix pour vous aider à commercialiser votre application dans le monde entier
Disponible immédiatement
Disponible immédiatement
Disponible immédiatement
Notre modèle multimodal le plus rapide offre d'excellentes performances pour diverses tâches répétitives et une fenêtre de contexte d'un million. Désormais en disponibilité générale pour une utilisation en production.
Sans frais*
Limites de débit**
15 tr/min (requêtes par minute)
1 million de TPM (jetons par minute)
1 500 RPD (requêtes par jour)
Prix (entrée)
Sans frais
mise en cache du contexte
Sans frais, jusqu'à un million de jetons de stockage par heure
Prix (sortie)
Sans frais
Requêtes/réponses utilisées pour améliorer nos produits
Oui
Paiement à l'usage (prix en USD)***
Limites de débit**
1 000 tr/min (requêtes par minute)
4 millions de TPM (jetons par minute)
Prix (entrée)
0,35 $ / 1 million de jetons (pour les invites comportant jusqu'à 128 000 jetons)
0,70 $ / 1 million de jetons (pour les requêtes de plus de 128 000)
mise en cache du contexte
0,0875 $ / 1 million de jetons (pour les invites comportant jusqu'à 128 000 jetons)
0,175 $ / 1 million de jetons (pour les requêtes de plus de 128 000)
1,00 $ / 1 million de jetons par heure (stockage)
Prix (sortie)
1,05 $ / 1 million de jetons (pour les invites comportant jusqu'à 128 000 jetons)
2,10 $ / 1 million de jetons (pour les requêtes de plus de 128 000)
Requêtes/réponses utilisées pour améliorer nos produits
Non
Notre modèle nouvelle génération avec une fenêtre de contexte révolutionnaire offrant 2 millions de fenêtres. Désormais en disponibilité générale pour une utilisation en production.
Sans frais*
Limites de débit**
2 tr/min (requêtes par minute)
32 000 TPM (jetons par minute)
50 RPD (requêtes par jour)
Prix (entrée)
Sans frais
mise en cache du contexte
Non applicable
Prix (sortie)
Sans frais
Requêtes/réponses utilisées pour améliorer nos produits
Oui
Paiement à l'usage (prix en USD)***
Limites de débit**
360 tr/min (requêtes par minute)
4 millions de TPM (jetons par minute)
10 000 RPD (requêtes par jour)
Prix (entrée)
3,50 $ / 1 million de jetons (pour les invites comportant jusqu'à 128 000 jetons)
7 $ / 1 million de jetons (pour les requêtes de plus de 128 000)
mise en cache du contexte
0,875 $ / 1 million de jetons (pour les invites comportant jusqu'à 128 000 jetons)
1,75 $ / 1 million de jetons (pour les requêtes de plus de 128 000)
4,50 $ / 1 million de jetons par heure (stockage)
Prix (sortie)
10,50 $ / 1 million de jetons (pour les invites comportant jusqu'à 128 000 jetons)
21 $ / 1 million de jetons (pour les requêtes de plus de 128 000 requêtes)
Requêtes/réponses utilisées pour améliorer nos produits
Non
Notre modèle de première génération n'offrant que le raisonnement à partir de texte et d'images. Disponibilité générale pour une utilisation en production.
Sans frais*
Limites de débit**
15 tr/min (requêtes par minute)
32 000 TPM (jetons par minute)
1 500 RPD (requêtes par jour)
Prix (entrée)
Sans frais
mise en cache du contexte
Non applicable
Prix (sortie)
Sans frais
Requêtes/réponses utilisées pour améliorer nos produits
Oui
Paiement à l'usage (prix en USD)***
Limites de débit**
360 tr/min (requêtes par minute)
120 000 TPM (jetons par minute)
30 000 RPD (requêtes par jour)
Prix (entrée)
0,50 $ / 1 million de jetons
mise en cache du contexte
Non disponible
Prix (sortie)
1,50 $ / 1 million de jetons
Requêtes/réponses utilisées pour améliorer nos produits
Non
*Les restrictions d'utilisation de la version sans frais de l'API Gemini s'appliquent à l'EEE (y compris à l'UE), au Royaume-Uni et à la Suisse. Voir Pour en savoir plus, consultez les questions fréquentes sur la facturation.
**Les limites de débit spécifiées ne sont pas garanties, et la capacité réelle peut varier. Demandez une augmentation de la limite de trafic maximale (pour le niveau payant uniquement).
***Les coûts d'inférence des modèles réglés sont facturés au même prix que les modèles de base. Pour obtenir de l'aide concernant la facturation, consultez Assistance Cloud Billing :
****Les prix peuvent être différents de ceux indiqués ici et de ceux proposés sur Vertex AI. Pour connaître les tarifs de Vertex, consultez la documentation Vertex.
Compiler avec Vertex AI sur Google Cloud