Ограничения скорости регулируют количество запросов, которые вы можете отправить к API Gemini в течение заданного периода времени. Эти ограничения помогают обеспечить справедливое использование, защитить от злоупотреблений и поддерживать производительность системы для всех пользователей.
Просмотрите активные лимиты трафика в AI Studio.
Как работают ограничения скорости запросов
Ограничения скорости обычно измеряются по трем параметрам:
- Количество запросов в минуту ( об/мин )
- Количество токенов в минуту (вход) ( TPM )
- Количество запросов в день ( RPD )
Ваше использование оценивается в соответствии с каждым лимитом, и превышение любого из них вызовет ошибку превышения лимита скорости. Например, если ваш лимит RPM равен 20, выполнение 21 запроса в минуту приведет к ошибке, даже если вы не превысили лимит TPM или другие лимиты.
Ограничения на количество запросов применяются к каждому проекту, а не к каждому ключу API. Квота на количество запросов в день ( RPD ) сбрасывается в полночь по тихоокеанскому времени.
Ограничения различаются в зависимости от используемой модели, и некоторые ограничения применяются только к определенным моделям. Например, показатель «Изображений в минуту» (IPM) рассчитывается только для моделей, способных генерировать изображения (Imagen 3), но концептуально аналогичен показателю «Общих данных в минуту» (TPM). Для других моделей может действовать ограничение на количество токенов в день (TPD).
Ограничения скорости запросов более строгие для экспериментальных и предварительных моделей.
Уровни использования
Ограничения на количество запросов привязаны к тарифному плану проекта. По мере увеличения использования API и расходов у вас появится возможность перейти на более высокий тарифный план с увеличенными лимитами на количество запросов.
Критерии отбора для уровней 2 и 3 основаны на общей сумме совокупных расходов на сервисы Google Cloud (включая, помимо прочего, API Gemini) по платежному аккаунту, связанному с вашим проектом.
| Уровень | Квалификации |
|---|---|
| Бесплатно | Пользователи в странах, имеющих право на участие. |
| Уровень 1 | Полностью оплаченный расчетный счет, привязанный к проекту. |
| Уровень 2 | Общая сумма расходов: > 250 долларов США и не менее 30 дней с момента успешной оплаты. |
| Уровень 3 | Общая сумма расходов: > 1000 долларов США и не менее 30 дней с момента успешной оплаты. |
При запросе на обновление наша автоматизированная система защиты от злоупотреблений выполняет дополнительные проверки. Хотя соответствие заявленным критериям, как правило, достаточно для одобрения, в редких случаях запрос на обновление может быть отклонен на основании других факторов, выявленных в процессе рассмотрения.
Эта система помогает поддерживать безопасность и целостность платформы Gemini API для всех пользователей.
Ограничения скорости запросов к API Gemini
Ограничения на количество запросов зависят от множества факторов (например, от вашего тарифного плана) и могут быть просмотрены в Google AI Studio. По мере изменения вашего тарифного плана и статуса учетной записи ваши ограничения на количество запросов будут автоматически обновляться.
Просмотрите активные лимиты трафика в AI Studio.
Указанные лимиты скорости не гарантируются, и фактическая пропускная способность может отличаться.
Ограничения скорости пакетной обработки API
На пакетные запросы к API распространяются собственные ограничения по частоте, отличные от ограничений на непакетные вызовы API.
- Количество одновременных пакетных запросов: 100
- Ограничение на размер входного файла: 2 ГБ
- Ограничение на объем хранилища файлов: 20 ГБ
- Количество поставленных в очередь токенов на модель: В таблице « Количество поставленных в очередь токенов для пакетной обработки» указано максимальное количество токенов, которые могут быть поставлены в очередь для пакетной обработки для всех активных пакетных заданий для данной модели.
Уровень 1
| Модель | Токены, добавленные в очередь пакетом | |||
|---|---|---|---|---|
| Модели для вывода текста | ||||
| Предварительный просмотр Gemini 3 Pro | 50 000 000 | |||
| Предварительный просмотр Gemini 3 Flash | 3 000 000 | |||
| Gemini 2.5 Pro | 5 000 000 | |||
| Вспышка Gemini 2.5 | 3 000 000 | |||
| Предварительная версия Gemini 2.5 Flash | 3 000 000 | |||
| Фонарь Gemini 2.5 Flash-Lite | 10 000 000 | |||
| Предварительный обзор Gemini 2.5 Flash-Lite | 10 000 000 | |||
| Gemini 2.0 Flash | 10 000 000 | |||
| Фонарик Gemini 2.0 | 10 000 000 | |||
| многомодальные модели генерации | ||||
| Предварительный просмотр изображения Gemini 3 Pro 🍌 | 2 000 000 | |||
Уровень 2
| Модель | Токены, добавленные в очередь пакетом | |||
|---|---|---|---|---|
| Модели для вывода текста | ||||
| Предварительный просмотр Gemini 3 Pro | 500 000 000 | |||
| Предварительный просмотр Gemini 3 Flash | 400 000 000 | |||
| Gemini 2.5 Pro | 500 000 000 | |||
| Вспышка Gemini 2.5 | 400 000 000 | |||
| Предварительная версия Gemini 2.5 Flash | 400 000 000 | |||
| Фонарь Gemini 2.5 Flash-Lite | 500 000 000 | |||
| Предварительный обзор Gemini 2.5 Flash-Lite | 500 000 000 | |||
| Gemini 2.0 Flash | 1 000 000 000 | |||
| Фонарик Gemini 2.0 | 1 000 000 000 | |||
| многомодальные модели генерации | ||||
| Предварительный просмотр изображения Gemini 3 Pro 🍌 | 270 000 000 | |||
Уровень 3
| Модель | Токены, добавленные в очередь пакетом | |||
|---|---|---|---|---|
| Модели для вывода текста | ||||
| Предварительный просмотр Gemini 3 Pro | 1 000 000 000 | |||
| Предварительный просмотр Gemini 3 Flash | 500 000 000 | |||
| Gemini 2.5 Pro | 1 000 000 000 | |||
| Вспышка Gemini 2.5 | 1 000 000 000 | |||
| Предварительная версия Gemini 2.5 Flash | 1 000 000 000 | |||
| Фонарь Gemini 2.5 Flash-Lite | 1 000 000 000 | |||
| Предварительный обзор Gemini 2.5 Flash-Lite | 1 000 000 000 | |||
| Gemini 2.0 Flash | 5 000 000 000 | |||
| Фонарик Gemini 2.0 | 5 000 000 000 | |||
| многомодальные модели генерации | ||||
| Предварительный просмотр изображения Gemini 3 Pro 🍌 | 1 000 000 000 | |||
Как перейти на следующий уровень
API Gemini использует облачную систему выставления счетов для всех платежных сервисов. Для перехода с бесплатного уровня на платный необходимо сначала включить облачную систему выставления счетов для вашего проекта Google Cloud.
Как только ваш проект будет соответствовать указанным критериям, он получит право на переход на следующий уровень. Чтобы запросить переход на следующий уровень, выполните следующие шаги:
- Перейдите на страницу ключей API в AI Studio.
- Найдите проект, который хотите обновить, и нажмите «Обновить». Опция «Обновить» появится только для проектов, соответствующих требованиям следующего уровня .
После быстрой проверки проект будет переведен на следующий уровень.
Запросить увеличение лимита запросов
Для каждой модификации модели установлено ограничение скорости запросов (запросов в минуту, RPM). Подробную информацию об этих ограничениях см. в описании моделей Gemini .
Запросить увеличение лимита трафика для платного тарифа
Мы не даем никаких гарантий по увеличению вашего лимита трафика, но мы сделаем все возможное, чтобы рассмотреть ваш запрос.