Limites de débit

Les limites de débit régulent le nombre de requêtes que vous pouvez envoyer à l'API Gemini dans un délai donné. Ces limites permettent de garantir une utilisation équitable, de se protéger contre les abus et de maintenir les performances du système pour tous les utilisateurs.

Afficher vos limites de débit actives dans AI Studio

Fonctionnement des limites de débit

Les limites de débit sont généralement mesurées selon trois dimensions :

  • Requêtes par minute (RPM)
  • Jetons par minute (entrée) (TPM)
  • Requêtes par jour (RPD)

Votre utilisation est évaluée par rapport à chaque limite. Si vous dépassez l'une d'elles, une erreur de limite de débit se déclenche. Par exemple, si votre limite de RPM est de 20, l'envoi de 21 requêtes en une minute entraînera une erreur, même si vous n'avez pas dépassé votre limite de TPM ou d'autres limites.

Les limites de débit sont appliquées par projet, et non par clé API. Les quotas de requêtes par jour (RPD) sont réinitialisés à minuit (heure du Pacifique).

Les limites varient en fonction du modèle spécifique utilisé, et certaines limites ne s'appliquent qu'à des modèles spécifiques. Par exemple, les images par minute (IPM) ne sont calculées que pour les modèles capables de générer des images (Nano Banana), mais sont conceptuellement similaires aux TPM. D'autres modèles peuvent avoir une limite de jetons par jour (TPD).

Les limites de débit sont plus restrictives pour les modèles expérimentaux et en preview.

Niveaux d'utilisation

Les limites de débit sont liées au niveau d'utilisation du projet. À mesure que votre utilisation et vos dépenses d'API augmentent, vous passez automatiquement à un niveau supérieur avec des limites de débit plus élevées.

Les conditions requises pour les niveaux 2 et 3 sont basées sur les dépenses cumulées totales pour les services Google Cloud (y compris, mais sans s'y limiter, l'API Gemini) pour le compte de facturation associé à votre projet.

Niveau d'utilisation Qualification Plafond du niveau de facturation
Free Projet actif ou essai sans frais N/A
Niveau 1 Configurer et associer un compte de facturation actif 250 $
Niveau 2 100 $ payés + 3 jours à compter du premier paiement réussi 2 000 $
Niveau 3 1 000 $ payés + 30 jours à compter du premier paiement réussi 20 000 $ à 100 000 $ et plus

Bien que le respect des critères de qualification indiqués soit généralement suffisant pour l'approbation, dans de rares cas, une demande de mise à niveau peut être refusée en fonction d'autres facteurs identifiés lors du processus d'examen.

Ce système permet de préserver la sécurité et l'intégrité de la plate-forme de l'API Gemini pour tous les utilisateurs.

Limites de débit de l'API Gemini

Les limites de débit dépendent de divers facteurs (tels que votre niveau d'utilisation) et peuvent être consultées dans Google AI Studio. À mesure que votre niveau et l'état de votre compte changent au fil du temps, vos limites de débit sont automatiquement mises à jour.

Afficher vos limites de débit actives dans AI Studio

Les limites de débit spécifiées ne sont pas garanties et la capacité réelle peut varier.

Limites de débit d'inférence prioritaires

La consommation prioritaire a ses propres limites de débit, même si la consommation est comptabilisée dans les limites de débit globales du trafic interactif. Les limites de débit par défaut sont les suivantes : 0,3 fois la limite de débit standard pour chaque modèle et niveau

Limites de débit de l'API par lot

Les requêtes d'API par lot sont soumises à leurs propres limites de débit, distinctes des appels d'API sans lot.

  • Requêtes par lot simultanées : 100
  • Limite de taille du fichier d'entrée : 2 Go
  • Limite de stockage de fichiers : 20 Go
  • Jetons en file d'attente par modèle : le tableau Jetons en file d'attente par lot indique le nombre maximal de jetons pouvant être mis en file d'attente pour le traitement par lot dans toutes vos tâches par lot actives pour un modèle donné.

Niveau 1

Modèle Jetons en file d'attente par lot
Modèles de sortie de texte
Gemini 3.1 Pro (preview) 5 000 000
Gemini 3.1 Flash-Lite 10 000 000
Gemini 3.1 Flash-Lite (preview) 10 000 000
Preview Gemini 3 Flash 3 000 000
Gemini 2.5 Pro 5 000 000
Gemini 2.5 Pro TTS 25 000
Gemini 2.0 Flash 3 000 000
Gemini 2.0 Flash (preview) 3 000 000
Gemini 2.0 Flash Image (preview) 3 000 000
Gemini 2.0 Flash TTS 100 000
Gemini 2.0 Flash-Lite 10 000 000
Gemini 2.0 Flash-Lite (preview) 10 000 000
Gemini 2.0 Flash 10 000 000
Gemini 2.0 Flash Image 3 000 000
Gemini 2.0 Flash-Lite 10 000 000
Modèles de génération multimodaux
Gemini 3.1 Flash Image (preview) 🍌 1 000 000
Gemini 3 Pro Image (preview) 🍌 2 000 000
Modèles d'embedding
Gemini Embedding 500 000

Niveau 2

Modèle Jetons en file d'attente par lot
Modèles de sortie de texte
Gemini 3.1 Pro (preview) 500 000 000
Gemini 3.1 Flash-Lite 500 000 000
Gemini 3.1 Flash-Lite (preview) 500 000 000
Preview Gemini 3 Flash 400 000 000
Gemini 2.5 Pro 500 000 000
Gemini 2.5 Pro TTS 100 000
Gemini 2.0 Flash 400 000 000
Gemini 2.0 Flash (preview) 400 000 000
Gemini 2.0 Flash Image (preview) 400 000 000
Gemini 2.0 Flash TTS 100 000
Gemini 2.0 Flash-Lite 500 000 000
Gemini 2.0 Flash-Lite (preview) 500 000 000
Gemini 2.0 Flash 1 000 000 000
Gemini 2.0 Flash Image 400 000 000
Gemini 2.0 Flash-Lite 1 000 000 000
Modèles de génération multimodaux
Gemini 3.1 Flash Image (preview) 🍌 250 000 000
Gemini 3 Pro Image (preview) 🍌 270 000 000
Modèles d'embedding
Gemini Embedding 5 000 000

Niveau 3

Modèle Jetons en file d'attente par lot
Modèles de sortie de texte
Gemini 3.1 Pro (preview) 1 000 000 000
Gemini 3.1 Flash-Lite 1 000 000 000
Gemini 3.1 Flash-Lite (preview) 1 000 000 000
Preview Gemini 3 Flash 1 000 000 000
Gemini 2.5 Pro 1 000 000 000
Gemini 2.5 Pro TTS 1 000 000
Gemini 2.0 Flash 1 000 000 000
Gemini 2.0 Flash (preview) 1 000 000 000
Gemini 2.0 Flash Image (preview) 1 000 000 000
Gemini 2.0 Flash TTS 4 000 000
Gemini 2.0 Flash-Lite 1 000 000 000
Gemini 2.0 Flash-Lite (preview) 1 000 000 000
Gemini 2.0 Flash 5 000 000 000
Gemini 2.0 Flash Image 1 000 000 000
Gemini 2.0 Flash-Lite 5 000 000 000
Modèles de génération multimodaux
Gemini 3.1 Flash Image (preview) 🍌 750 000 000
Gemini 3 Pro Image (preview) 🍌 1 000 000 000
Modèles d'embedding
Gemini Embedding 10 000 000

Passer au niveau supérieur

Pour passer du niveau Free à un niveau payant, vous devez d'abord configurer la facturation dans AI Studio.

Une fois que votre projet répond aux critères spécifiés, il passe automatiquement au niveau supérieur. Les mises à niveau du niveau Free au niveau 1 prennent généralement effet instantanément, et les mises à niveau ultérieures prennent effet dans les 10 minutes. Accédez à la page Projets dans AI Studio pour vérifier vos niveaux.

Demander une augmentation de la limite de débit

Chaque variante de modèle est associée à une limite de débit (requêtes par minute, RPM). Pour en savoir plus sur ces limites de débit, consultez la page Limites de débit d'AI Studio.

Demander une augmentation de la limite de débit du niveau payant

Nous ne pouvons pas garantir l'augmentation de votre limite de débit, mais nous ferons de notre mieux pour examiner votre demande.