Ограничения скорости определяют количество запросов, которые вы можете сделать к API Gemini в течение заданного периода времени. Эти ограничения помогают обеспечить добросовестное использование, защитить от злоупотреблений и поддерживать производительность системы для всех пользователей.
Просмотр активных ограничений скорости в AI Studio
Как работают ограничения скорости
Пределы скорости обычно измеряются по трем параметрам:
- Запросов в минуту ( RPM )
- Токенов в минуту (вход) ( TPM )
- Запросов в день ( RPD )
Ваше использование оценивается по каждому лимиту, и превышение любого из них приведёт к ошибке ограничения скорости. Например, если ваш лимит RPM равен 20, выполнение 21 запроса в течение минуты приведёт к ошибке, даже если вы не превысили TPM или другие лимиты.
Ограничения по скорости применяются к проекту, а не к ключу API. Квоты на запросы в день ( RPD ) сбрасываются в полночь по тихоокеанскому времени.
Ограничения различаются в зависимости от используемой модели, а некоторые ограничения применяются только к определённым моделям. Например, показатель количества изображений в минуту (IPM) рассчитывается только для моделей, способных генерировать изображения (Imagen 3), но концептуально аналогичен показателю TPM. В других моделях может быть установлен лимит количества токенов в день (TPD).
Для экспериментальных и предварительных моделей ограничения скорости более строгие.
Уровни использования
Ограничения по скорости привязаны к уровню использования проекта. По мере роста использования API и расходов вы сможете перейти на более высокий уровень с более высокими ограничениями по скорости.
Квалификации для уровней 2 и 3 основаны на общих совокупных расходах на сервисы Google Cloud (включая, помимо прочего, API Gemini) для платежного аккаунта, связанного с вашим проектом.
| Уровень | Квалификации |
|---|---|
| Бесплатно | Пользователи в странах, имеющих на это право |
| Уровень 1 | Полностью оплаченный счет, привязанный к проекту |
| Уровень 2 | Общая сумма расходов: > 250 долларов США и не менее 30 дней с момента успешной оплаты |
| Уровень 3 | Общая сумма расходов: > 1000 долларов США и не менее 30 дней с момента успешной оплаты |
При запросе обновления наша автоматизированная система защиты от злоупотреблений выполняет дополнительные проверки. Хотя соответствие заявленным критериям, как правило, достаточно для одобрения, в редких случаях запрос на обновление может быть отклонен на основании других факторов, выявленных в процессе проверки.
Эта система помогает поддерживать безопасность и целостность платформы Gemini API для всех пользователей.
Ограничения скорости API Gemini
Ограничения по скорости зависят от ряда факторов (например, от уровня вашей квоты) и могут быть просмотрены в Google AI Studio. По мере изменения вашего уровня и статуса аккаунта ваши ограничения по скорости будут автоматически обновляться.
Просмотр активных ограничений скорости в AI Studio
Указанные ограничения скорости не гарантируются, а фактическая пропускная способность может отличаться.
Ограничения скорости пакетного API
Пакетные запросы API имеют свои собственные ограничения по скорости, отдельные от непакетных вызовов API.
- Одновременные пакетные запросы: 100
- Ограничение на размер входного файла: 2 ГБ
- Лимит хранилища файлов: 20 ГБ
- Количество поставленных в очередь токенов на модель: В таблице « Количество поставленных в очередь токенов для пакетной обработки» указано максимальное количество токенов, которые могут быть поставлены в очередь для пакетной обработки для всех активных пакетных заданий для данной модели.
Уровень 1
| Модель | Токены, добавленные в очередь пакетом | |||
|---|---|---|---|---|
| Модели для ввода текста | ||||
| Предварительный обзор Gemini 3 Pro | 50 000 000 | |||
| Gemini 2.5 Pro | 5,000,000 | |||
| Вспышка Gemini 2.5 | 3 000 000 | |||
| Предварительный просмотр Gemini 2.5 Flash | 3 000 000 | |||
| Фонарь Gemini 2.5 Flash-Lite | 10 000 000 | |||
| Предварительный просмотр Gemini 2.5 Flash-Lite | 10 000 000 | |||
| Gemini 2.0 Flash | 10 000 000 | |||
| Gemini 2.0 Flash-Lite | 10 000 000 | |||
| Мультимодальные модели генерации | ||||
| Предварительный просмотр изображения Gemini 3 Pro 🍌 | 2 000 000 | |||
Уровень 2
| Модель | Токены, добавленные в очередь пакетом | |||
|---|---|---|---|---|
| Модели для ввода текста | ||||
| Предварительный обзор Gemini 3 Pro | 500 000 000 | |||
| Gemini 2.5 Pro | 500 000 000 | |||
| Вспышка Gemini 2.5 | 400,000,000 | |||
| Предварительный просмотр Gemini 2.5 Flash | 400,000,000 | |||
| Фонарь Gemini 2.5 Flash-Lite | 500 000 000 | |||
| Предварительный просмотр Gemini 2.5 Flash-Lite | 500 000 000 | |||
| Gemini 2.0 Flash | 1,000,000,000 | |||
| Gemini 2.0 Flash-Lite | 1,000,000,000 | |||
| Мультимодальные модели генерации | ||||
| Предварительный просмотр изображения Gemini 3 Pro 🍌 | 270,000,000 | |||
Уровень 3
| Модель | Токены, добавленные в очередь пакетом | |||
|---|---|---|---|---|
| Модели для ввода текста | ||||
| Предварительный обзор Gemini 3 Pro | 1,000,000,000 | |||
| Gemini 2.5 Pro | 1,000,000,000 | |||
| Вспышка Gemini 2.5 | 1,000,000,000 | |||
| Предварительный просмотр Gemini 2.5 Flash | 1,000,000,000 | |||
| Фонарь Gemini 2.5 Flash-Lite | 1,000,000,000 | |||
| Предварительный просмотр Gemini 2.5 Flash-Lite | 1,000,000,000 | |||
| Gemini 2.0 Flash | 5,000,000,000 | |||
| Gemini 2.0 Flash-Lite | 5,000,000,000 | |||
| Мультимодальные модели генерации | ||||
| Предварительный просмотр изображения Gemini 3 Pro 🍌 | 1,000,000,000 | |||
Как перейти на следующий уровень
API Gemini использует Cloud Billing для всех биллинговых сервисов. Чтобы перейти с бесплатного тарифа на платный, необходимо сначала включить Cloud Billing для вашего проекта Google Cloud.
Как только ваш проект будет соответствовать указанным критериям, он получит право на повышение уровня. Чтобы запросить повышение уровня, выполните следующие действия:
- Перейдите на страницу ключей API в AI Studio.
- Найдите проект, который вы хотите обновить, и нажмите «Обновить». Эта опция будет доступна только для проектов, соответствующих требованиям следующего уровня .
После быстрой проверки проект будет повышен до следующего уровня.
Запросить увеличение лимита ставки
Для каждой модели существует ограничение скорости (количество запросов в минуту, RPM). Подробнее об этих ограничениях см. в разделе «Модели Gemini» .
Запросить увеличение лимита платной ставки
Мы не даем никаких гарантий относительно увеличения вашего лимита ставки, но мы сделаем все возможное, чтобы рассмотреть ваш запрос.