Les limites de débit régulent le nombre de requêtes que vous pouvez envoyer à l'API Gemini dans un délai donné. Ces limites permettent de garantir une utilisation équitable, de se protéger contre les abus et de maintenir les performances du système pour tous les utilisateurs.
Afficher vos limites de débit actives dans AI Studio
Fonctionnement des limites de débit
Les limites de débit sont généralement mesurées selon trois dimensions :
- Requêtes par minute (RPM)
- Jetons par minute (entrée) (TPM)
- Requêtes par jour (RPD)
Votre utilisation est évaluée par rapport à chaque limite. Si vous dépassez l'une d'elles, une erreur de limite de débit se déclenche. Par exemple, si votre limite de RPM est de 20, l'envoi de 21 requêtes en une minute entraînera une erreur, même si vous n'avez pas dépassé votre limite de TPM ou d'autres limites.
Les limites de débit sont appliquées par projet, et non par clé API. Les quotas de requêtes par jour (RPD) sont réinitialisés à minuit (heure du Pacifique).
Les limites varient en fonction du modèle spécifique utilisé, et certaines limites ne s'appliquent qu'à des modèles spécifiques. Par exemple, les images par minute (IPM) ne sont calculées que pour les modèles capables de générer des images (Nano Banana), mais sont conceptuellement similaires aux TPM. D'autres modèles peuvent avoir une limite de jetons par jour (TPD).
Les limites de débit sont plus restrictives pour les modèles expérimentaux et en preview.
Niveaux d'utilisation
Les limites de débit sont liées au niveau d'utilisation du projet. À mesure que votre utilisation et vos dépenses d'API augmentent, vous passez automatiquement à un niveau supérieur avec des limites de débit plus élevées.
Les conditions requises pour les niveaux 2 et 3 sont basées sur les dépenses cumulées totales pour les services Google Cloud (y compris, mais sans s'y limiter, l'API Gemini) pour le compte de facturation associé à votre projet.
| Niveau d'utilisation | Qualification | Plafond du niveau de facturation |
|---|---|---|
| Free | Projet actif ou essai sans frais | N/A |
| Niveau 1 | Configurer et associer un compte de facturation actif | 250 $ |
| Niveau 2 | 100 $ payés + 3 jours à compter du premier paiement réussi | 2 000 $ |
| Niveau 3 | 1 000 $ payés + 30 jours à compter du premier paiement réussi | 20 000 $ à 100 000 $ et plus |
Bien que le respect des critères de qualification indiqués soit généralement suffisant pour l'approbation, dans de rares cas, une demande de mise à niveau peut être refusée en fonction d'autres facteurs identifiés lors du processus d'examen.
Ce système permet de préserver la sécurité et l'intégrité de la plate-forme de l'API Gemini pour tous les utilisateurs.
Limites de débit de l'API Gemini
Les limites de débit dépendent de divers facteurs (tels que votre niveau d'utilisation) et peuvent être consultées dans Google AI Studio. À mesure que votre niveau et l'état de votre compte changent au fil du temps, vos limites de débit sont automatiquement mises à jour.
Afficher vos limites de débit actives dans AI Studio
Les limites de débit spécifiées ne sont pas garanties et la capacité réelle peut varier.
Limites de débit d'inférence prioritaires
La consommation prioritaire a ses propres limites de débit, même si la consommation est comptabilisée dans les limites de débit globales du trafic interactif. Les limites de débit par défaut sont les suivantes : 0,3 fois la limite de débit standard pour chaque modèle et niveau
Limites de débit de l'API par lot
Les requêtes d'API par lot sont soumises à leurs propres limites de débit, distinctes des appels d'API sans lot.
- Requêtes par lot simultanées : 100
- Limite de taille du fichier d'entrée : 2 Go
- Limite de stockage de fichiers : 20 Go
- Jetons en file d'attente par modèle : le tableau Jetons en file d'attente par lot indique le nombre maximal de jetons pouvant être mis en file d'attente pour le traitement par lot dans toutes vos tâches par lot actives pour un modèle donné.
Niveau 1
| Modèle | Jetons en file d'attente par lot | |||
|---|---|---|---|---|
| Modèles de sortie de texte | ||||
| Gemini 3.1 Pro (preview) | 5 000 000 | |||
| Gemini 3.1 Flash-Lite | 10 000 000 | |||
| Gemini 3.1 Flash-Lite (preview) | 10 000 000 | |||
| Preview Gemini 3 Flash | 3 000 000 | |||
| Gemini 2.5 Pro | 5 000 000 | |||
| Gemini 2.5 Pro TTS | 25 000 | |||
| Gemini 2.0 Flash | 3 000 000 | |||
| Gemini 2.0 Flash (preview) | 3 000 000 | |||
| Gemini 2.0 Flash Image (preview) | 3 000 000 | |||
| Gemini 2.0 Flash TTS | 100 000 | |||
| Gemini 2.0 Flash-Lite | 10 000 000 | |||
| Gemini 2.0 Flash-Lite (preview) | 10 000 000 | |||
| Gemini 2.0 Flash | 10 000 000 | |||
| Gemini 2.0 Flash Image | 3 000 000 | |||
| Gemini 2.0 Flash-Lite | 10 000 000 | |||
| Modèles de génération multimodaux | ||||
| Gemini 3.1 Flash Image (preview) 🍌 | 1 000 000 | |||
| Gemini 3 Pro Image (preview) 🍌 | 2 000 000 | |||
| Modèles d'embedding | ||||
| Gemini Embedding | 500 000 | |||
Niveau 2
| Modèle | Jetons en file d'attente par lot | |||
|---|---|---|---|---|
| Modèles de sortie de texte | ||||
| Gemini 3.1 Pro (preview) | 500 000 000 | |||
| Gemini 3.1 Flash-Lite | 500 000 000 | |||
| Gemini 3.1 Flash-Lite (preview) | 500 000 000 | |||
| Preview Gemini 3 Flash | 400 000 000 | |||
| Gemini 2.5 Pro | 500 000 000 | |||
| Gemini 2.5 Pro TTS | 100 000 | |||
| Gemini 2.0 Flash | 400 000 000 | |||
| Gemini 2.0 Flash (preview) | 400 000 000 | |||
| Gemini 2.0 Flash Image (preview) | 400 000 000 | |||
| Gemini 2.0 Flash TTS | 100 000 | |||
| Gemini 2.0 Flash-Lite | 500 000 000 | |||
| Gemini 2.0 Flash-Lite (preview) | 500 000 000 | |||
| Gemini 2.0 Flash | 1 000 000 000 | |||
| Gemini 2.0 Flash Image | 400 000 000 | |||
| Gemini 2.0 Flash-Lite | 1 000 000 000 | |||
| Modèles de génération multimodaux | ||||
| Gemini 3.1 Flash Image (preview) 🍌 | 250 000 000 | |||
| Gemini 3 Pro Image (preview) 🍌 | 270 000 000 | |||
| Modèles d'embedding | ||||
| Gemini Embedding | 5 000 000 | |||
Niveau 3
| Modèle | Jetons en file d'attente par lot | |||
|---|---|---|---|---|
| Modèles de sortie de texte | ||||
| Gemini 3.1 Pro (preview) | 1 000 000 000 | |||
| Gemini 3.1 Flash-Lite | 1 000 000 000 | |||
| Gemini 3.1 Flash-Lite (preview) | 1 000 000 000 | |||
| Preview Gemini 3 Flash | 1 000 000 000 | |||
| Gemini 2.5 Pro | 1 000 000 000 | |||
| Gemini 2.5 Pro TTS | 1 000 000 | |||
| Gemini 2.0 Flash | 1 000 000 000 | |||
| Gemini 2.0 Flash (preview) | 1 000 000 000 | |||
| Gemini 2.0 Flash Image (preview) | 1 000 000 000 | |||
| Gemini 2.0 Flash TTS | 4 000 000 | |||
| Gemini 2.0 Flash-Lite | 1 000 000 000 | |||
| Gemini 2.0 Flash-Lite (preview) | 1 000 000 000 | |||
| Gemini 2.0 Flash | 5 000 000 000 | |||
| Gemini 2.0 Flash Image | 1 000 000 000 | |||
| Gemini 2.0 Flash-Lite | 5 000 000 000 | |||
| Modèles de génération multimodaux | ||||
| Gemini 3.1 Flash Image (preview) 🍌 | 750 000 000 | |||
| Gemini 3 Pro Image (preview) 🍌 | 1 000 000 000 | |||
| Modèles d'embedding | ||||
| Gemini Embedding | 10 000 000 | |||
Passer au niveau supérieur
Pour passer du niveau Free à un niveau payant, vous devez d'abord configurer la facturation dans AI Studio.
Une fois que votre projet répond aux critères spécifiés, il passe automatiquement au niveau supérieur. Les mises à niveau du niveau Free au niveau 1 prennent généralement effet instantanément, et les mises à niveau ultérieures prennent effet dans les 10 minutes. Accédez à la page Projets dans AI Studio pour vérifier vos niveaux.
Demander une augmentation de la limite de débit
Chaque variante de modèle est associée à une limite de débit (requêtes par minute, RPM). Pour en savoir plus sur ces limites de débit, consultez la page Limites de débit d'AI Studio.
Demander une augmentation de la limite de débit du niveau payant
Nous ne pouvons pas garantir l'augmentation de votre limite de débit, mais nous ferons de notre mieux pour examiner votre demande.