Ограничения скорости регулируют количество запросов, которые вы можете отправить к API Gemini в течение заданного периода времени. Эти ограничения помогают обеспечить справедливое использование, защитить от злоупотреблений и поддерживать производительность системы для всех пользователей.
Просмотрите активные лимиты трафика в AI Studio.
Как работают ограничения скорости запросов
Ограничения скорости обычно измеряются по трем параметрам:
- Количество запросов в минуту ( об/мин )
- Количество токенов в минуту (вход) ( TPM )
- Количество запросов в день ( RPD )
Ваше использование оценивается в соответствии с каждым лимитом, и превышение любого из них вызовет ошибку превышения лимита скорости. Например, если ваш лимит RPM равен 20, выполнение 21 запроса в минуту приведет к ошибке, даже если вы не превысили лимит TPM или другие лимиты.
Ограничения на количество запросов применяются к каждому проекту, а не к каждому ключу API. Квота на количество запросов в день ( RPD ) сбрасывается в полночь по тихоокеанскому времени.
Ограничения различаются в зависимости от используемой модели, и некоторые ограничения применяются только к определенным моделям. Например, количество изображений в минуту (IPM) рассчитывается только для моделей, способных генерировать изображения (Nano Banana), но концептуально схоже с TPM. Для других моделей может действовать ограничение на количество токенов в день (TPD).
Для экспериментальных и предварительных моделей действуют более строгие ограничения по количеству запросов.
Уровни использования
Ограничения на количество запросов привязаны к уровню использования проекта. По мере увеличения использования API и расходов вы будете автоматически переведены на более высокий уровень с увеличенными лимитами на количество запросов.
Критерии отбора для уровней 2 и 3 основаны на общей сумме совокупных расходов на сервисы Google Cloud (включая, помимо прочего, API Gemini) по платежному аккаунту, связанному с вашим проектом.
| Уровень | Квалификации |
|---|---|
| Бесплатно | Пользователи в странах, имеющих право на участие. |
| Уровень 1 | Полностью оплаченный расчетный счет, привязанный к проекту. |
| Уровень 2 | Общая сумма расходов: > 250 долларов США и не менее 30 дней с момента успешной оплаты. |
| Уровень 3 | Общая сумма расходов: > 1000 долларов США и не менее 30 дней с момента успешной оплаты. |
При запросе на обновление наша автоматизированная система защиты от злоупотреблений выполняет дополнительные проверки. Хотя соответствие заявленным критериям, как правило, достаточно для одобрения, в редких случаях запрос на обновление может быть отклонен на основании других факторов, выявленных в процессе рассмотрения.
Эта система помогает поддерживать безопасность и целостность платформы Gemini API для всех пользователей.
Ограничения скорости запросов к API Gemini
Ограничения на количество запросов зависят от множества факторов (например, от вашего тарифного плана) и могут быть просмотрены в Google AI Studio. По мере изменения вашего тарифного плана и статуса учетной записи ваши ограничения на количество запросов будут автоматически обновляться.
Просмотрите активные лимиты трафика в AI Studio.
Указанные лимиты скорости не гарантируются, и фактическая пропускная способность может отличаться.
Ограничения скорости пакетной обработки API
На пакетные запросы к API распространяются собственные ограничения по частоте, отличные от ограничений на непакетные вызовы API.
- Количество одновременных пакетных запросов: 100
- Ограничение на размер входного файла: 2 ГБ
- Ограничение на объем хранилища файлов: 20 ГБ
- Количество поставленных в очередь токенов на модель: В таблице « Количество поставленных в очередь токенов для пакетной обработки» указано максимальное количество токенов, которые могут быть поставлены в очередь для пакетной обработки для всех активных пакетных заданий для данной модели.
Уровень 1
| Модель | Токены, добавленные в очередь пакетом | |||
|---|---|---|---|---|
| Модели для ввода текста | ||||
| Gemini 3.1 Pro Preview | 5 000 000 | |||
| Предварительный просмотр Gemini 3 Pro | 5 000 000 | |||
| Предварительный просмотр Gemini 3 Flash | 3 000 000 | |||
| Gemini 2.5 Pro | 5 000 000 | |||
| Gemini 2.5 Pro TTS | 25 000 | |||
| Вспышка Gemini 2.5 | 3 000 000 | |||
| Предварительная версия Gemini 2.5 Flash | 3 000 000 | |||
| Предварительный просмотр изображения Gemini 2.5 Flash | 3 000 000 | |||
| Gemini 2.5 Flash TTS | 100,000 | |||
| Фонарь Gemini 2.5 Flash-Lite | 10 000 000 | |||
| Предварительный обзор Gemini 2.5 Flash-Lite | 10 000 000 | |||
| Gemini 2.0 Flash | 10 000 000 | |||
| Изображение Gemini 2.0 Flash | 3 000 000 | |||
| Фонарик Gemini 2.0 | 10 000 000 | |||
| многомодальные модели генерации | ||||
| Предварительный просмотр изображения Gemini 3 Pro 🍌 | 2 000 000 | |||
Уровень 2
| Модель | Токены, добавленные в очередь пакетом | |||
|---|---|---|---|---|
| Модели для ввода текста | ||||
| Gemini 3.1 Pro Preview | 500 000 000 | |||
| Предварительный просмотр Gemini 3 Pro | 500 000 000 | |||
| Предварительный просмотр Gemini 3 Flash | 400 000 000 | |||
| Gemini 2.5 Pro | 500 000 000 | |||
| Gemini 2.5 Pro TTS | 100,000 | |||
| Вспышка Gemini 2.5 | 400 000 000 | |||
| Предварительная версия Gemini 2.5 Flash | 400 000 000 | |||
| Предварительный просмотр изображения Gemini 2.5 Flash | 400 000 000 | |||
| Gemini 2.5 Flash TTS | 100,000 | |||
| Фонарь Gemini 2.5 Flash-Lite | 500 000 000 | |||
| Предварительный обзор Gemini 2.5 Flash-Lite | 500 000 000 | |||
| Gemini 2.0 Flash | 1 000 000 000 | |||
| Изображение Gemini 2.0 Flash | 400 000 000 | |||
| Фонарик Gemini 2.0 | 1 000 000 000 | |||
| многомодальные модели генерации | ||||
| Предварительный просмотр изображения Gemini 3 Pro 🍌 | 270 000 000 | |||
Уровень 3
| Модель | Токены, добавленные в очередь пакетом | |||
|---|---|---|---|---|
| Модели для ввода текста | ||||
| Gemini 3.1 Pro Preview | 1 000 000 000 | |||
| Предварительный просмотр Gemini 3 Pro | 1 000 000 000 | |||
| Предварительный просмотр Gemini 3 Flash | 1 000 000 000 | |||
| Gemini 2.5 Pro | 1 000 000 000 | |||
| Gemini 2.5 Pro TTS | 1 000 000 | |||
| Вспышка Gemini 2.5 | 1 000 000 000 | |||
| Предварительная версия Gemini 2.5 Flash | 1 000 000 000 | |||
| Предварительный просмотр изображения Gemini 2.5 Flash | 1 000 000 000 | |||
| Gemini 2.5 Flash TTS | 4 000 000 | |||
| Фонарь Gemini 2.5 Flash-Lite | 1 000 000 000 | |||
| Предварительный обзор Gemini 2.5 Flash-Lite | 1 000 000 000 | |||
| Gemini 2.0 Flash | 5 000 000 000 | |||
| Изображение Gemini 2.0 Flash | 1 000 000 000 | |||
| Фонарик Gemini 2.0 | 5 000 000 000 | |||
| многомодальные модели генерации | ||||
| Предварительный просмотр изображения Gemini 3 Pro 🍌 | 1 000 000 000 | |||
Как перейти на следующий уровень
Для перехода с бесплатного уровня на платный необходимо сначала настроить оплату в AI Studio .
Как только ваш проект будет соответствовать указанным критериям , он будет автоматически переведен на следующий уровень. Переход с бесплатного уровня на уровень 1 обычно вступает в силу мгновенно, а последующие переходы на следующий уровень — в течение 10 минут. Перейдите на страницу «Проекты» в AI Studio, чтобы проверить свои уровни.
Запросить увеличение лимита запросов
Для каждой модификации модели установлено ограничение по количеству запросов в минуту (об/мин). Подробную информацию об этих ограничениях см. на странице «Ограничения скорости запросов в AI Studio» .
Запросить увеличение лимита трафика для платного тарифа
Мы не даем никаких гарантий по увеличению вашего лимита трафика, но мы сделаем все возможное, чтобы рассмотреть ваш запрос.