Ограничения ставок

Ограничения скорости регулируют количество запросов, которые вы можете отправить к API Gemini в течение заданного периода времени. Эти ограничения помогают обеспечить справедливое использование, защитить от злоупотреблений и поддерживать производительность системы для всех пользователей.

Просмотрите активные лимиты трафика в AI Studio.

Как работают ограничения скорости запросов

Ограничения скорости обычно измеряются по трем параметрам:

  • Количество запросов в минуту ( об/мин )
  • Количество токенов в минуту (вход) ( TPM )
  • Количество запросов в день ( RPD )

Ваше использование оценивается в соответствии с каждым лимитом, и превышение любого из них вызовет ошибку превышения лимита скорости. Например, если ваш лимит RPM равен 20, выполнение 21 запроса в минуту приведет к ошибке, даже если вы не превысили лимит TPM или другие лимиты.

Ограничения на количество запросов применяются к каждому проекту, а не к каждому ключу API. Квота на количество запросов в день ( RPD ) сбрасывается в полночь по тихоокеанскому времени.

Ограничения различаются в зависимости от используемой модели, и некоторые ограничения применяются только к определенным моделям. Например, показатель «Изображений в минуту» (IPM) рассчитывается только для моделей, способных генерировать изображения (Imagen 3), но концептуально аналогичен показателю «Общих данных в минуту» (TPM). Для других моделей может действовать ограничение на количество токенов в день (TPD).

Ограничения скорости запросов более строгие для экспериментальных и предварительных моделей.

Уровни использования

Ограничения на количество запросов привязаны к тарифному плану проекта. По мере увеличения использования API и расходов у вас появится возможность перейти на более высокий тарифный план с увеличенными лимитами на количество запросов.

Критерии отбора для уровней 2 и 3 основаны на общей сумме совокупных расходов на сервисы Google Cloud (включая, помимо прочего, API Gemini) по платежному аккаунту, связанному с вашим проектом.

Уровень Квалификации
Бесплатно Пользователи в странах, имеющих право на участие.
Уровень 1 Полностью оплаченный расчетный счет, привязанный к проекту.
Уровень 2 Общая сумма расходов: > 250 долларов США и не менее 30 дней с момента успешной оплаты.
Уровень 3 Общая сумма расходов: > 1000 долларов США и не менее 30 дней с момента успешной оплаты.

При запросе на обновление наша автоматизированная система защиты от злоупотреблений выполняет дополнительные проверки. Хотя соответствие заявленным критериям, как правило, достаточно для одобрения, в редких случаях запрос на обновление может быть отклонен на основании других факторов, выявленных в процессе рассмотрения.

Эта система помогает поддерживать безопасность и целостность платформы Gemini API для всех пользователей.

Ограничения скорости запросов к API Gemini

Ограничения на количество запросов зависят от множества факторов (например, от вашего тарифного плана) и могут быть просмотрены в Google AI Studio. По мере изменения вашего тарифного плана и статуса учетной записи ваши ограничения на количество запросов будут автоматически обновляться.

Просмотрите активные лимиты трафика в AI Studio.

Указанные лимиты скорости не гарантируются, и фактическая пропускная способность может отличаться.

Ограничения скорости пакетной обработки API

На пакетные запросы к API распространяются собственные ограничения по частоте, отличные от ограничений на непакетные вызовы API.

  • Количество одновременных пакетных запросов: 100
  • Ограничение на размер входного файла: 2 ГБ
  • Ограничение на объем хранилища файлов: 20 ГБ
  • Количество поставленных в очередь токенов на модель: В таблице « Количество поставленных в очередь токенов для пакетной обработки» указано максимальное количество токенов, которые могут быть поставлены в очередь для пакетной обработки для всех активных пакетных заданий для данной модели.

Уровень 1

Модель Токены, добавленные в очередь пакетом
Модели для вывода текста
Предварительный просмотр Gemini 3 Pro 50 000 000
Предварительный просмотр Gemini 3 Flash 3 000 000
Gemini 2.5 Pro 5 000 000
Вспышка Gemini 2.5 3 000 000
Предварительная версия Gemini 2.5 Flash 3 000 000
Фонарь Gemini 2.5 Flash-Lite 10 000 000
Предварительный обзор Gemini 2.5 Flash-Lite 10 000 000
Gemini 2.0 Flash 10 000 000
Фонарик Gemini 2.0 10 000 000
многомодальные модели генерации
Предварительный просмотр изображения Gemini 3 Pro 🍌 2 000 000

Уровень 2

Модель Токены, добавленные в очередь пакетом
Модели для вывода текста
Предварительный просмотр Gemini 3 Pro 500 000 000
Предварительный просмотр Gemini 3 Flash 400 000 000
Gemini 2.5 Pro 500 000 000
Вспышка Gemini 2.5 400 000 000
Предварительная версия Gemini 2.5 Flash 400 000 000
Фонарь Gemini 2.5 Flash-Lite 500 000 000
Предварительный обзор Gemini 2.5 Flash-Lite 500 000 000
Gemini 2.0 Flash 1 000 000 000
Фонарик Gemini 2.0 1 000 000 000
многомодальные модели генерации
Предварительный просмотр изображения Gemini 3 Pro 🍌 270 000 000

Уровень 3

Модель Токены, добавленные в очередь пакетом
Модели для вывода текста
Предварительный просмотр Gemini 3 Pro 1 000 000 000
Предварительный просмотр Gemini 3 Flash 500 000 000
Gemini 2.5 Pro 1 000 000 000
Вспышка Gemini 2.5 1 000 000 000
Предварительная версия Gemini 2.5 Flash 1 000 000 000
Фонарь Gemini 2.5 Flash-Lite 1 000 000 000
Предварительный обзор Gemini 2.5 Flash-Lite 1 000 000 000
Gemini 2.0 Flash 5 000 000 000
Фонарик Gemini 2.0 5 000 000 000
многомодальные модели генерации
Предварительный просмотр изображения Gemini 3 Pro 🍌 1 000 000 000

Как перейти на следующий уровень

API Gemini использует облачную систему выставления счетов для всех платежных сервисов. Для перехода с бесплатного уровня на платный необходимо сначала включить облачную систему выставления счетов для вашего проекта Google Cloud.

Как только ваш проект будет соответствовать указанным критериям, он получит право на переход на следующий уровень. Чтобы запросить переход на следующий уровень, выполните следующие шаги:

После быстрой проверки проект будет переведен на следующий уровень.

Запросить увеличение лимита запросов

Для каждой модификации модели установлено ограничение скорости запросов (запросов в минуту, RPM). Подробную информацию об этих ограничениях см. в описании моделей Gemini .

Запросить увеличение лимита трафика для платного тарифа

Мы не даем никаких гарантий по увеличению вашего лимита трафика, но мы сделаем все возможное, чтобы рассмотреть ваш запрос.