Limites de débit

Les limites de débit régissent le nombre de requêtes que vous pouvez envoyer à l'API Gemini au cours d'une période donnée. Ces limites permettent de maintenir une utilisation équitable, de protéger contre les utilisations abusives et de préserver les performances du système pour tous les utilisateurs.

Afficher vos limites de fréquence actives dans AI Studio

Fonctionnement des limites de débit

Les limites de débit sont généralement mesurées selon trois dimensions :

  • Requêtes par minute (RPM)
  • Jetons par minute (entrée) (TPM)
  • Requêtes par jour (RPD)

Votre utilisation est évaluée par rapport à chaque limite. Si vous dépassez l'une d'elles, une erreur de limitation du débit se déclenchera. Par exemple, si votre limite de requêtes par minute est de 20, vous recevrez un message d'erreur si vous effectuez 21 requêtes en une minute, même si vous n'avez pas dépassé votre limite de requêtes par minute ni d'autres limites.

Les limites de débit sont appliquées par projet, et non par clé API. Les quotas de RPD sont réinitialisés à minuit (heure du Pacifique).

Les limites varient en fonction du modèle spécifique utilisé, et certaines limites ne s'appliquent qu'à certains modèles. Par exemple, les images par minute (IPM) ne sont calculées que pour les modèles capables de générer des images (Nano Banana), mais sont conceptuellement similaires aux TPM. D'autres modèles peuvent avoir une limite de jetons par jour (TPD).

Les limites de débit sont plus strictes pour les modèles expérimentaux et en version preview.

Limites de débit basées sur les dépenses

En plus des limites de requêtes par minute (RPM) et de jetons par minute (TPM), l'API Gemini applique des limites de débit basées sur les dépenses pour se protéger contre les frais inattendus. L'application de ces limites à votre compte dépend de votre historique de facturation et de votre niveau d'utilisation.

Le tableau suivant indique les limites de débit basées sur les dépenses pour chaque niveau d'utilisation. Ces limites sont évaluées sur une période de 10 minutes. L'application de ces limites à votre compte dépend de votre historique de facturation et de l'état de votre compte.

Niveau d'utilisation Limitation du débit des dépenses (par tranche de 10 minutes)
Free N/A
Niveau 1 10 $
Niveau 2 200 $
Niveau 3 200 $

Si vous atteignez une limite de débit basée sur les dépenses, l'API renvoie une erreur 429 RESOURCE_EXHAUSTED. Pour remédier à ce problème, procédez comme suit :

  • Patientez un moment, puis réessayez.
  • Réduisez le taux de requêtes coûteuses, par exemple en utilisant des fenêtres de contexte plus petites ou des sorties plus courtes.
  • Si vous atteignez régulièrement cette limite lors d'une utilisation normale, demandez une augmentation de la limite de fréquence.

Niveaux d'utilisation

Les limites de débit sont liées au niveau d'utilisation du projet. À mesure que votre utilisation et vos dépenses liées aux API augmentent, vous passez automatiquement à un niveau supérieur avec des limites de débit plus élevées.

Les critères d'éligibilité aux niveaux 2 et 3 sont basés sur les dépenses cumulées totales pour les services Google Cloud (y compris, mais sans s'y limiter, l'API Gemini) pour le compte de facturation associé à votre projet.

Niveau d'utilisation Qualification Plafond du niveau de facturation
Free Projet actif ou essai sans frais N/A
Niveau 1 Configurer et associer un compte de facturation actif 250 $
Niveau 2 Paiement de 100 $ effectué trois jours après le premier paiement réussi 2 000 $
Niveau 3 1 000 $ payés + 30 jours à compter du premier paiement réussi 20 000 $ - 100 000 $ et plus

Bien que le respect des critères d'éligibilité indiqués soit généralement suffisant pour l'approbation, il peut arriver, dans de rares cas, qu'une demande de mise à niveau soit refusée en fonction d'autres facteurs identifiés lors de la procédure d'examen.

Ce système permet de préserver la sécurité et l'intégrité de la plate-forme de l'API Gemini pour tous les utilisateurs.

Limites de débit de l'API Gemini

Les limites de débit dépendent de différents facteurs (comme votre niveau d'utilisation) et peuvent être consultées dans Google AI Studio. Vos limites de débit seront automatiquement mises à jour en fonction de votre niveau et de l'état de votre compte.

Afficher vos limites de fréquence actives dans AI Studio

Les limites de débit spécifiées ne sont pas garanties et la capacité réelle peut varier.

Limites de débit pour l'inférence de priorité

La consommation prioritaire possède ses propres limites de débit, même si la consommation est comptabilisée dans les limites de débit globales du trafic interactif. Les limites de débit par défaut sont les suivantes : 0,3 fois la limite de débit standard pour chaque modèle et niveau

Limites de débit de l'API Batch

Les requêtes Batch API sont soumises à leurs propres limites de débit, distinctes de celles des appels d'API non par lot.

  • Requêtes par lot simultanées : 100
  • Taille maximale du fichier d'entrée : 2 Go
  • Limite de stockage des fichiers : 20 Go
  • Jetons mis en file d'attente par modèle : le tableau Jetons mis en file d'attente par lot indique le nombre maximal de jetons pouvant être mis en file d'attente pour le traitement par lot dans toutes vos tâches par lot actives pour un modèle donné.

Niveau 1

Modèle Jetons en file d'attente par lot
Modèles de sortie de texte
Preview Gemini 3.1 Pro 5 000 000
Gemini 3.1 Flash-Lite 10 000 000
Preview Gemini 3.1 Flash-Lite 10 000 000
Gemini 3.5 Flash 3 000 000
Gemini 3.5 Flash 3 000 000
Gemini 2.5 Pro 5 000 000
Gemini 2.5 Pro TTS 25 000
Gemini 2.0 Flash 3 000 000
Preview Gemini 2.5 Flash 3 000 000
Preview Gemini 2.5 Flash Image 3 000 000
Gemini 2.5 Flash TTS 100 000
Gemini 2.5 Flash-Lite 10 000 000
Preview Gemini 2.5 Flash-Lite 10 000 000
Gemini 2.0 Flash 10 000 000
Image Gemini 2.0 Flash 3 000 000
Gemini 2.0 Flash-Lite 10 000 000
Modèles de génération multimodaux
Preview de l'image Gemini 3.1 Flash 🍌 1 000 000
Preview Gemini 3 Pro Image 🍌 2 000 000
Modèles d'embeddings
Embedding Gemini 500 000

Niveau 2

Modèle Jetons en file d'attente par lot
Modèles de sortie de texte
Preview Gemini 3.1 Pro 500 000 000
Gemini 3.1 Flash-Lite 500 000 000
Preview Gemini 3.1 Flash-Lite 500 000 000
Gemini 3.5 Flash 400 000 000
Gemini 3.5 Flash 400 000 000
Gemini 2.5 Pro 500 000 000
Gemini 2.5 Pro TTS 100 000
Gemini 2.0 Flash 400 000 000
Preview Gemini 2.5 Flash 400 000 000
Preview Gemini 2.5 Flash Image 400 000 000
Gemini 2.5 Flash TTS 100 000
Gemini 2.5 Flash-Lite 500 000 000
Preview Gemini 2.5 Flash-Lite 500 000 000
Gemini 2.0 Flash 1 000 000 000
Image Gemini 2.0 Flash 400 000 000
Gemini 2.0 Flash-Lite 1 000 000 000
Modèles de génération multimodaux
Preview de l'image Gemini 3.1 Flash 🍌 250 000 000
Preview Gemini 3 Pro Image 🍌 270 000 000
Modèles d'embeddings
Embedding Gemini 5 000 000

Niveau 3

Modèle Jetons en file d'attente par lot
Modèles de sortie de texte
Preview Gemini 3.1 Pro 1 000 000 000
Gemini 3.1 Flash-Lite 1 000 000 000
Preview Gemini 3.1 Flash-Lite 1 000 000 000
Gemini 3.5 Flash 1 000 000 000
Gemini 3.5 Flash 1 000 000 000
Gemini 2.5 Pro 1 000 000 000
Gemini 2.5 Pro TTS 1 000 000
Gemini 2.0 Flash 1 000 000 000
Preview Gemini 2.5 Flash 1 000 000 000
Preview Gemini 2.5 Flash Image 1 000 000 000
Gemini 2.5 Flash TTS 4 000 000
Gemini 2.5 Flash-Lite 1 000 000 000
Preview Gemini 2.5 Flash-Lite 1 000 000 000
Gemini 2.0 Flash 5 000 000 000
Image Gemini 2.0 Flash 1 000 000 000
Gemini 2.0 Flash-Lite 5 000 000 000
Modèles de génération multimodaux
Preview de l'image Gemini 3.1 Flash 🍌 750 000 000
Preview Gemini 3 Pro Image 🍌 1 000 000 000
Modèles d'embeddings
Embedding Gemini 10 000 000

Passer au niveau supérieur

Pour passer du forfait sans frais à un forfait payant, vous devez d'abord configurer la facturation dans AI Studio.

Une fois que votre projet répond aux critères spécifiés, il est automatiquement mis à niveau vers le niveau supérieur. Les mises à niveau de la version sans frais vers le niveau 1 prennent généralement effet instantanément, tandis que les mises à niveau vers les niveaux suivants prennent effet sous 10 minutes. Accédez à la page "Projets" dans AI Studio pour vérifier vos niveaux.

Demander une augmentation de la limite de débit

Chaque variante de modèle est associée à une limite de fréquence (requêtes par minute, RPM). Pour en savoir plus sur ces limites de débit, consultez la page Limites de débit d'AI Studio.

Demander une augmentation de la limite de débit pour les niveaux payants

Nous ne pouvons pas vous garantir que nous augmenterons votre limite de débit, mais nous ferons de notre mieux pour examiner votre demande.