Limites de débit

Les limites de débit régissent le nombre de requêtes que vous pouvez envoyer à l'API Gemini au cours d'une période donnée. Ces limites permettent de garantir une utilisation équitable, de protéger contre les utilisations abusives et de maintenir les performances du système pour tous les utilisateurs.

Afficher vos limites de débit actives dans AI Studio

Fonctionnement des limites de débit

Les limites de débit sont généralement mesurées selon trois dimensions :

  • Requêtes par minute (RPM)
  • Jetons par minute (entrée) (TPM)
  • Requêtes par jour (RPD)

Votre utilisation est évaluée par rapport à chaque limite. Si vous dépassez l'une d'elles, une erreur de limitation du débit se déclenche. Par exemple, si votre limite de requêtes par minute est de 20, vous recevrez un message d'erreur si vous envoyez 21 requêtes en une minute, même si vous n'avez pas dépassé votre limite de requêtes par période ou d'autres limites.

Les limites de débit sont appliquées par projet, et non par clé API. Les quotas de RPD (requêtes par jour) sont réinitialisés à minuit (heure du Pacifique).

Les limites varient en fonction du modèle spécifique utilisé, et certaines limites ne s'appliquent qu'à certains modèles. Par exemple, les images par minute (IPM) ne sont calculées que pour les modèles capables de générer des images (Nano Banana), mais sont conceptuellement similaires aux TPM. D'autres modèles peuvent avoir une limite de jetons par jour (TPD).

Les limites de débit sont plus strictes pour les modèles expérimentaux et en version preview.

Niveaux d'utilisation

Les limites de débit sont liées au niveau d'utilisation du projet. À mesure que votre utilisation et vos dépenses liées aux API augmentent, vous passez automatiquement à un niveau supérieur avec des limites de débit plus élevées.

Les critères d'éligibilité aux niveaux 2 et 3 sont basés sur les dépenses cumulées totales pour les services Google Cloud (y compris, mais sans s'y limiter, l'API Gemini) pour le compte de facturation associé à votre projet.

Niveau d'utilisation Qualification Plafond du niveau de facturation
Free Projet actif ou essai sans frais N/A
Niveau 1 Configurer et associer un compte de facturation actif 250 $
Niveau 2 100 $payés + 3 jours après le premier paiement réussi 2 000 $
Niveau 3 1 000 $payés + 30 jours à compter du premier paiement réussi 20 000 $ - 100 000 $ et plus

Bien que le respect des critères d'éligibilité indiqués soit généralement suffisant pour l'approbation, il peut arriver, dans de rares cas, qu'une demande de mise à niveau soit refusée en fonction d'autres facteurs identifiés lors de la procédure d'examen.

Ce système permet de préserver la sécurité et l'intégrité de la plate-forme de l'API Gemini pour tous les utilisateurs.

Limites de débit de l'API Gemini

Les limites de débit dépendent de divers facteurs (comme votre niveau d'utilisation) et peuvent être consultées dans Google AI Studio. À mesure que votre niveau et l'état de votre compte évoluent, vos limites de débit sont automatiquement mises à jour.

Afficher vos limites de débit actives dans AI Studio

Les limites de débit spécifiées ne sont pas garanties et la capacité réelle peut varier.

Limites de débit de l'API par lot

Les requêtes Batch API sont soumises à leurs propres limites de débit, distinctes de celles des appels d'API non par lot.

  • Requêtes par lot simultanées : 100
  • Taille maximale du fichier d'entrée : 2 Go
  • Limite de stockage des fichiers : 20 Go
  • Jetons mis en file d'attente par modèle : le tableau Jetons mis en file d'attente par lot indique le nombre maximal de jetons pouvant être mis en file d'attente pour le traitement par lot dans toutes vos tâches par lot actives pour un modèle donné.

Niveau 1

Modèle Jetons mis en file d'attente par lot
Modèles de sortie de texte
Gemini 3.1 Pro (preview) 5 000 000
Gemini 3.1 Flash-Lite (preview) 10 000 000
Aperçu de Gemini 3 Flash 3 000 000
Gemini 2.5 Pro 5 000 000
Gemini 2.5 Pro TTS 25 000
Gemini 2.0 Flash 3 000 000
Aperçu de Gemini 2.5 Flash 3 000 000
Aperçu de Gemini 2.5 Flash Image 3 000 000
Gemini 2.5 Flash TTS 100 000
Gemini 2.5 Flash-Lite 10 000 000
Aperçu de Gemini 2.5 Flash-Lite 10 000 000
Gemini 2.0 Flash 10 000 000
Image Gemini 2.0 Flash 3 000 000
Gemini 2.0 Flash-Lite 10 000 000
Modèles de génération multimodale
Aperçu de Gemini 3.1 Flash Image 🍌 1 000 000
Aperçu de l'image Gemini 3 Pro 🍌 2 000 000
Modèles d'embeddings
Embedding Gemini 500 000

Niveau 2

Modèle Jetons mis en file d'attente par lot
Modèles de sortie de texte
Gemini 3.1 Pro (preview) 500 000 000
Gemini 3.1 Flash-Lite (preview) 500 000 000
Gemini 3.1 Flash Preview 400 000 000
Gemini 2.5 Pro 500 000 000
Gemini 2.5 Pro TTS 100 000
Gemini 2.0 Flash 400 000 000
Aperçu de Gemini 2.5 Flash 400 000 000
Aperçu de Gemini 2.5 Flash Image 400 000 000
Gemini 2.5 Flash TTS 100 000
Gemini 2.5 Flash-Lite 500 000 000
Aperçu de Gemini 2.5 Flash-Lite 500 000 000
Gemini 2.0 Flash 1 000 000 000
Image Gemini 2.0 Flash 400 000 000
Gemini 2.0 Flash-Lite 1 000 000 000
Modèles de génération multimodale
Aperçu de Gemini 3.1 Flash Image 🍌 250 000 000
Aperçu de l'image Gemini 3 Pro 🍌 270 000 000
Modèles d'embeddings
Embedding Gemini 5 000 000

Niveau 3

Modèle Jetons mis en file d'attente par lot
Modèles de sortie de texte
Gemini 3.1 Pro (preview) 1 000 000 000
Gemini 3.1 Flash-Lite (preview) 1 000 000 000
Gemini 3.1 Flash Preview 1 000 000 000
Gemini 2.5 Pro 1 000 000 000
Gemini 2.5 Pro TTS 1 000 000
Gemini 2.0 Flash 1 000 000 000
Aperçu de Gemini 2.5 Flash 1 000 000 000
Aperçu de Gemini 2.5 Flash Image 1 000 000 000
Gemini 2.5 Flash TTS 4 000 000
Gemini 2.5 Flash-Lite 1 000 000 000
Aperçu de Gemini 2.5 Flash-Lite 1 000 000 000
Gemini 2.0 Flash 5 000 000 000
Image Gemini 2.0 Flash 1 000 000 000
Gemini 2.0 Flash-Lite 5 000 000 000
Modèles de génération multimodale
Aperçu de Gemini 3.1 Flash Image 🍌 750 000 000
Aperçu de l'image Gemini 3 Pro 🍌 1 000 000 000
Modèles d'embeddings
Embedding Gemini 10 000 000

Passer au niveau supérieur

Pour passer du forfait sans frais à un forfait payant, vous devez d'abord configurer la facturation dans AI Studio.

Une fois que votre projet répond aux critères spécifiés, il est automatiquement mis à niveau vers le niveau supérieur. Les mises à niveau de la version sans frais vers le niveau 1 prennent généralement effet instantanément, tandis que les mises à niveau vers les niveaux suivants prennent effet sous 10 minutes. Accédez à la page "Projets" dans AI Studio pour vérifier vos niveaux.

Demander une augmentation de la limite de fréquence

Chaque variante de modèle est associée à une limite de fréquence (requêtes par minute, RPM). Pour en savoir plus sur ces limites de débit, consultez la page Limites de débit d'AI Studio.

Demander une augmentation de la limite de débit pour le niveau payant

Nous ne pouvons pas vous garantir que nous augmenterons votre limite de débit, mais nous ferons de notre mieux pour examiner votre demande.