Ограничения ставок

Ограничения скорости регулируют количество запросов, которые вы можете отправить к API Gemini в течение заданного периода времени. Эти ограничения помогают обеспечить справедливое использование, защитить от злоупотреблений и поддерживать производительность системы для всех пользователей.

Просмотрите активные лимиты трафика в AI Studio.

Как работают ограничения скорости запросов

Ограничения скорости обычно измеряются по трем параметрам:

  • Количество запросов в минуту ( об/мин )
  • Количество токенов в минуту (вход) ( TPM )
  • Количество запросов в день ( RPD )

Ваше использование оценивается в соответствии с каждым лимитом, и превышение любого из них вызовет ошибку превышения лимита скорости. Например, если ваш лимит RPM равен 20, выполнение 21 запроса в минуту приведет к ошибке, даже если вы не превысили лимит TPM или другие лимиты.

Ограничения на количество запросов применяются к каждому проекту, а не к каждому ключу API. Квота на количество запросов в день ( RPD ) сбрасывается в полночь по тихоокеанскому времени.

Ограничения различаются в зависимости от используемой модели, и некоторые ограничения применяются только к определенным моделям. Например, количество изображений в минуту (IPM) рассчитывается только для моделей, способных генерировать изображения (Nano Banana), но концептуально схоже с TPM. Для других моделей может действовать ограничение на количество токенов в день (TPD).

Для экспериментальных и предварительных моделей действуют более строгие ограничения по количеству запросов.

Уровни использования

Ограничения на количество запросов привязаны к уровню использования проекта. По мере увеличения использования API и расходов вы будете автоматически переведены на более высокий уровень с увеличенными лимитами на количество запросов.

Критерии отбора для уровней 2 и 3 основаны на общей сумме совокупных расходов на сервисы Google Cloud (включая, помимо прочего, API Gemini) по платежному аккаунту, связанному с вашим проектом.

Уровень Квалификации
Бесплатно Пользователи в странах, имеющих право на участие.
Уровень 1 Полностью оплаченный расчетный счет, привязанный к проекту.
Уровень 2 Общая сумма расходов: > 250 долларов США и не менее 30 дней с момента успешной оплаты.
Уровень 3 Общая сумма расходов: > 1000 долларов США и не менее 30 дней с момента успешной оплаты.

При запросе на обновление наша автоматизированная система защиты от злоупотреблений выполняет дополнительные проверки. Хотя соответствие заявленным критериям, как правило, достаточно для одобрения, в редких случаях запрос на обновление может быть отклонен на основании других факторов, выявленных в процессе рассмотрения.

Эта система помогает поддерживать безопасность и целостность платформы Gemini API для всех пользователей.

Ограничения скорости запросов к API Gemini

Ограничения на количество запросов зависят от множества факторов (например, от вашего тарифного плана) и могут быть просмотрены в Google AI Studio. По мере изменения вашего тарифного плана и статуса учетной записи ваши ограничения на количество запросов будут автоматически обновляться.

Просмотрите активные лимиты трафика в AI Studio.

Указанные лимиты скорости не гарантируются, и фактическая пропускная способность может отличаться.

Ограничения скорости пакетной обработки API

На пакетные запросы к API распространяются собственные ограничения по частоте, отличные от ограничений на непакетные вызовы API.

  • Количество одновременных пакетных запросов: 100
  • Ограничение на размер входного файла: 2 ГБ
  • Ограничение на объем хранилища файлов: 20 ГБ
  • Количество поставленных в очередь токенов на модель: В таблице « Количество поставленных в очередь токенов для пакетной обработки» указано максимальное количество токенов, которые могут быть поставлены в очередь для пакетной обработки для всех активных пакетных заданий для данной модели.

Уровень 1

Модель Токены, добавленные в очередь пакетом
Модели для ввода текста
Gemini 3.1 Pro Preview 5 000 000
Предварительный просмотр Gemini 3 Pro 5 000 000
Предварительный просмотр Gemini 3 Flash 3 000 000
Gemini 2.5 Pro 5 000 000
Gemini 2.5 Pro TTS 25 000
Вспышка Gemini 2.5 3 000 000
Предварительная версия Gemini 2.5 Flash 3 000 000
Предварительный просмотр изображения Gemini 2.5 Flash 3 000 000
Gemini 2.5 Flash TTS 100,000
Фонарь Gemini 2.5 Flash-Lite 10 000 000
Предварительный обзор Gemini 2.5 Flash-Lite 10 000 000
Gemini 2.0 Flash 10 000 000
Изображение Gemini 2.0 Flash 3 000 000
Фонарик Gemini 2.0 10 000 000
многомодальные модели генерации
Предварительный просмотр изображения Gemini 3 Pro 🍌 2 000 000

Уровень 2

Модель Токены, добавленные в очередь пакетом
Модели для ввода текста
Gemini 3.1 Pro Preview 500 000 000
Предварительный просмотр Gemini 3 Pro 500 000 000
Предварительный просмотр Gemini 3 Flash 400 000 000
Gemini 2.5 Pro 500 000 000
Gemini 2.5 Pro TTS 100,000
Вспышка Gemini 2.5 400 000 000
Предварительная версия Gemini 2.5 Flash 400 000 000
Предварительный просмотр изображения Gemini 2.5 Flash 400 000 000
Gemini 2.5 Flash TTS 100,000
Фонарь Gemini 2.5 Flash-Lite 500 000 000
Предварительный обзор Gemini 2.5 Flash-Lite 500 000 000
Gemini 2.0 Flash 1 000 000 000
Изображение Gemini 2.0 Flash 400 000 000
Фонарик Gemini 2.0 1 000 000 000
многомодальные модели генерации
Предварительный просмотр изображения Gemini 3 Pro 🍌 270 000 000

Уровень 3

Модель Токены, добавленные в очередь пакетом
Модели для ввода текста
Gemini 3.1 Pro Preview 1 000 000 000
Предварительный просмотр Gemini 3 Pro 1 000 000 000
Предварительный просмотр Gemini 3 Flash 1 000 000 000
Gemini 2.5 Pro 1 000 000 000
Gemini 2.5 Pro TTS 1 000 000
Вспышка Gemini 2.5 1 000 000 000
Предварительная версия Gemini 2.5 Flash 1 000 000 000
Предварительный просмотр изображения Gemini 2.5 Flash 1 000 000 000
Gemini 2.5 Flash TTS 4 000 000
Фонарь Gemini 2.5 Flash-Lite 1 000 000 000
Предварительный обзор Gemini 2.5 Flash-Lite 1 000 000 000
Gemini 2.0 Flash 5 000 000 000
Изображение Gemini 2.0 Flash 1 000 000 000
Фонарик Gemini 2.0 5 000 000 000
многомодальные модели генерации
Предварительный просмотр изображения Gemini 3 Pro 🍌 1 000 000 000

Как перейти на следующий уровень

Для перехода с бесплатного уровня на платный необходимо сначала настроить оплату в AI Studio .

Как только ваш проект будет соответствовать указанным критериям , он будет автоматически переведен на следующий уровень. Переход с бесплатного уровня на уровень 1 обычно вступает в силу мгновенно, а последующие переходы на следующий уровень — в течение 10 минут. Перейдите на страницу «Проекты» в AI Studio, чтобы проверить свои уровни.

Запросить увеличение лимита запросов

Для каждой модификации модели установлено ограничение по количеству запросов в минуту (об/мин). Подробную информацию об этих ограничениях см. на странице «Ограничения скорости запросов в AI Studio» .

Запросить увеличение лимита трафика для платного тарифа

Мы не даем никаких гарантий по увеличению вашего лимита трафика, но мы сделаем все возможное, чтобы рассмотреть ваш запрос.