Ограничения скорости определяют количество запросов, которые вы можете сделать к API Gemini в течение заданного периода времени. Эти ограничения помогают обеспечить добросовестное использование, защитить от злоупотреблений и поддерживать производительность системы для всех пользователей.
Как работают ограничения скорости
Пределы скорости обычно измеряются по трем параметрам:
- Запросов в минуту ( RPM )
- Запросов в день ( RPD )
- Токенов в минуту (вход) ( TPM )
Ваше использование оценивается по каждому лимиту, и превышение любого из них приведёт к ошибке ограничения скорости. Например, если ваш лимит RPM равен 20, выполнение 21 запроса в течение минуты приведёт к ошибке, даже если вы не превысили TPM или другие лимиты.
Ограничения по скорости применяются к проекту, а не к ключу API.
Ограничения различаются в зависимости от используемой модели, а некоторые ограничения применяются только к определённым моделям. Например, показатель количества изображений в минуту (IPM) рассчитывается только для моделей, способных генерировать изображения (Imagen 3), но концептуально аналогичен показателю TPM. В других моделях может быть установлен лимит количества токенов в день (TPD).
Для экспериментальных и предварительных моделей ограничения скорости более строгие.
Уровни использования
Ограничения по скорости привязаны к уровню использования проекта. По мере роста использования API и расходов вы сможете перейти на более высокий уровень с более высокими ограничениями по скорости.
Уровень | Квалификации |
---|---|
Бесплатно | Пользователи в странах, имеющих на это право |
Уровень 1 | Платежный аккаунт , привязанный к проекту |
Уровень 2 | Общая сумма расходов: > 250 долларов США и не менее 30 дней с момента успешной оплаты |
Уровень 3 | Общая сумма расходов: > 1000 долларов США и не менее 30 дней с момента успешной оплаты |
При запросе обновления наша автоматизированная система защиты от злоупотреблений выполняет дополнительные проверки. Хотя соответствие заявленным критериям, как правило, достаточно для одобрения, в редких случаях запрос на обновление может быть отклонен на основании других факторов, выявленных в процессе проверки.
Эта система помогает поддерживать безопасность и целостность платформы Gemini API для всех пользователей.
Стандартные ограничения скорости API
В следующей таблице перечислены ограничения скорости для всех стандартных вызовов API Gemini.
Бесплатный уровень
Модель | Обороты в минуту | ТРМ | РПД |
---|---|---|---|
Близнецы 2.5 Про | 5 | 250,000 | 100 |
Близнецы 2.5 Флэш | 10 | 250,000 | 250 |
Gemini 2.5 Flash-Lite Preview 06-17 | 15 | 250,000 | 1000 |
Gemini 2.5 Flash Предварительный просмотр TTS | 3 | 10,000 | 15 |
Gemini 2.5 Pro Preview TTS | -- | -- | -- |
Близнецы 2.0 Флэш | 15 | 1,000,000 | 200 |
Генерация изображений предварительного просмотра Flash Gemini 2.0 | 10 | 200,000 | 100 |
Gemini 2.0 Flash-Lite | 30 | 1,000,000 | 200 |
Изображение 3 | -- | -- | -- |
Вео 2 | -- | -- | -- |
Gemini 1.5 Flash (устарело) | 15 | 250,000 | 50 |
Gemini 1.5 Flash-8B (устарело) | 15 | 250,000 | 50 |
Gemini 1.5 Pro (устарело) | -- | -- | -- |
Джемма 3 и 3н | 30 | 15,000 | 14,400 |
Gemini Embedding Experimental 03-07 | 5 | -- | 100 |
Уровень 1
Модель | Обороты в минуту | ТРМ | РПД |
---|---|---|---|
Близнецы 2.5 Про | 150 | 2,000,000 | 1000 |
Близнецы 2.5 Флэш | 1000 | 1,000,000 | 10,000 |
Gemini 2.5 Flash-Lite Preview 06-17 | 4000 | 4,000,000 | -- |
Gemini 2.5 Flash Предварительный просмотр TTS | 10 | 10,000 | 100 |
Gemini 2.5 Pro Preview TTS | 10 | 10,000 | 50 |
Близнецы 2.0 Флэш | 2000 | 4,000,000 | -- |
Генерация изображений предварительного просмотра Flash Gemini 2.0 | 1000 | 1,000,000 | 10,000 |
Gemini 2.0 Flash-Lite | 4000 | 4,000,000 | -- |
Имидж 4 стандарт | 10 | -- | 70 |
Imagen 4 Ultra | 5 | -- | 30 |
Изображение 3 | 20 | -- | -- |
Вео 2 | 2 видео в минуту | -- | 50 видео в день |
Gemini 1.5 Flash (устарело) | 2000 | 4,000,000 | -- |
Gemini 1.5 Flash-8B (устарело) | 4000 | 4,000,000 | -- |
Gemini 1.5 Pro (устарело) | 1000 | 4,000,000 | -- |
Джемма 3 и 3н | 30 | 15,000 | 14,400 |
Gemini Embedding Experimental 03-07 | 10 | -- | 1000 |
Уровень 2
Модель | Обороты в минуту | ТРМ | РПД |
---|---|---|---|
Близнецы 2.5 Про | 1000 | 5,000,000 | 50,000 |
Близнецы 2.5 Флэш | 2000 | 3,000,000 | 100,000 |
Gemini 2.5 Flash-Lite Preview 06-17 | 10,000 | 10 000 000 | 100,000 |
Gemini 2.5 Flash Предварительный просмотр TTS | 1000 | 100,000 | 10,000 |
Gemini 2.5 Pro Preview TTS | 100 | 25,000 | 1000 |
Близнецы 2.0 Флэш | 10,000 | 10 000 000 | -- |
Генерация изображений предварительного просмотра Flash Gemini 2.0 | 2000 | 3,000,000 | 100,000 |
Gemini 2.0 Flash-Lite | 20,000 | 10 000 000 | -- |
Имидж 4 стандарт | 10 | -- | 70 |
Imagen 4 Ultra | 5 | -- | 30 |
Изображение 3 | 20 | -- | -- |
Вео 2 | 2 видео в минуту | -- | 50 видео в день |
Gemini 1.5 Flash (устарело) | 2000 | 4,000,000 | -- |
Gemini 1.5 Flash-8B (устарело) | 4000 | 4,000,000 | -- |
Gemini 1.5 Pro (устарело) | 1000 | 4,000,000 | -- |
Джемма 3 и 3н | 30 | 15,000 | 14,400 |
Gemini Embedding Experimental 03-07 | 10 | -- | 1000 |
Уровень 3
Модель | Обороты в минуту | ТРМ | РПД |
---|---|---|---|
Близнецы 2.5 Про | 2000 | 8,000,000 | -- |
Близнецы 2.5 Флэш | 10,000 | 8,000,000 | -- |
Gemini 2.5 Flash-Lite Preview 06-17 | 30,000 | 30 000 000 | -- |
Gemini 2.5 Flash Предварительный просмотр TTS | 1000 | 1,000,000 | -- |
Gemini 2.5 Pro Preview TTS | 100 | 1,000,000 | -- |
Близнецы 2.0 Флэш | 30,000 | 30 000 000 | -- |
Генерация изображений предварительного просмотра Flash Gemini 2.0 | 5000 | 5,000,000 | -- |
Gemini 2.0 Flash-Lite | 30,000 | 30 000 000 | -- |
Имидж 4 стандарт | 10 | -- | 70 |
Imagen 4 Ultra | 5 | -- | 30 |
Изображение 3 | 20 | -- | -- |
Вео 2 | 2 видео в минуту | -- | 50 видео в день |
Gemini 1.5 Flash (устарело) | 2000 | 4,000,000 | -- |
Gemini 1.5 Flash-8B (устарело) | 4000 | 4,000,000 | -- |
Gemini 1.5 Pro (устарело) | 1000 | 4,000,000 | -- |
Джемма 3 и 3н | 30 | 15,000 | 14,400 |
Gemini Embedding Experimental 03-07 | 10 | -- | 1000 |
Указанные ограничения скорости не гарантируются, а фактическая пропускная способность может отличаться.
Ограничения скорости API в реальном времени
API Live обрабатывает непрерывные потоки аудио, видео и текста, обеспечивая мгновенные, похожие на человеческие, голосовые ответы, создавая для ваших пользователей ощущение естественного общения. Этот API имеет другие ограничения по частоте вызовов, чем стандартные вызовы API Gemini.
Бесплатный уровень
Имя | Одновременные сеансы | ТРМ | РПД |
---|---|---|---|
Gemini 2.5 Flash Live | 3 | 1,000,000 | -- |
Gemini 2.0 Flash Live | 3 | 1,000,000 | -- |
Gemini 2.5 Flash Preview Native Audio Dialog | 1 | 25,000 | 5 |
Gemini 2.5 Flash Экспериментальный диалог Native Audio Thinking | 1 | 10,000 | 5 |
Уровень 1
Имя | Одновременные сеансы | ТРМ | РПД |
---|---|---|---|
Gemini 2.5 Flash Live | 50 | 4,000,000 | -- |
Gemini 2.0 Flash Live | 50 | 4,000,000 | -- |
Gemini 2.5 Flash Preview Native Audio Dialog | 3 | 50,000 | 50 |
Gemini 2.5 Flash Экспериментальный диалог Native Audio Thinking | 1 | 25,000 | 50 |
Уровень 2
Имя | Одновременные сеансы | ТРМ | РПД |
---|---|---|---|
Gemini 2.5 Flash Live | 1000 | 10 000 000 | -- |
Gemini 2.0 Flash Live | 1000 | 10 000 000 | -- |
Gemini 2.5 Flash Preview Native Audio Dialog | 100 | 1,000,000 | Неограниченный |
Gemini 2.5 Flash Экспериментальный диалог Native Audio Thinking | -- | -- | -- |
Уровень 3
Имя | Одновременные сеансы | ТРМ | РПД |
---|---|---|---|
Gemini 2.5 Flash Live | 1000 | 10 000 000 | -- |
Gemini 2.0 Flash Live | 1000 | 10 000 000 | -- |
Gemini 2.5 Flash Preview Native Audio Dialog | -- | -- | -- |
Gemini 2.5 Flash Экспериментальный диалог Native Audio Thinking | -- | -- | -- |
Указанные ограничения скорости не гарантируются, а фактическая пропускная способность может отличаться.
Ограничения скорости пакетного режима
Запросы в пакетном режиме имеют собственные ограничения по скорости, отличные от вызовов API в непакетном режиме.
- Одновременные пакетные запросы: 100
- Ограничение на размер входного файла: 2 ГБ
- Лимит хранилища файлов: 20 ГБ
- Токены, поставленные в очередь на модель: в следующей таблице указано максимальное количество токенов, которые можно поставить в очередь для пакетной обработки по всем активным пакетным заданиям для данной модели.
Уровень 1
Модель | Лимит токенов в очереди |
---|---|
Близнецы 2.5 Про | 5,000,000 |
Близнецы 2.5 Флэш | 3,000,000 |
Близнецы 2.0 Флэш | 10 000 000 |
Gemini 2.0 Flash-Lite | 10 000 000 |
Уровень 2
Модель | Лимит токенов в очереди |
---|---|
Близнецы 2.5 Про | 500,000,000 |
Близнецы 2.5 Флэш | 400,000,000 |
Близнецы 2.0 Флэш | 1,000,000,000 |
Gemini 2.0 Flash-Lite | 1,000,000,000 |
Уровень 3
Модель | Лимит токенов в очереди |
---|---|
Близнецы 2.5 Про | 1,000,000,000 |
Близнецы 2.5 Флэш | 1,000,000,000 |
Близнецы 2.0 Флэш | 5,000,000,000 |
Gemini 2.0 Flash-Lite | 5,000,000,000 |
Указанные ограничения скорости не гарантируются, а фактическая пропускная способность может отличаться.
Как перейти на следующий уровень
API Gemini использует Cloud Billing для всех биллинговых сервисов. Чтобы перейти с бесплатного тарифа на платный, необходимо сначала включить Cloud Billing для вашего проекта Google Cloud.
Как только ваш проект будет соответствовать указанным критериям, он получит право на повышение уровня. Чтобы запросить повышение уровня, выполните следующие действия:
- Перейдите на страницу ключей API в AI Studio.
- Найдите проект, который вы хотите обновить, и нажмите «Обновить». Эта опция будет доступна только для проектов, соответствующих требованиям следующего уровня .
После быстрой проверки проект будет повышен до следующего уровня.
Запросить увеличение лимита ставки
Для каждой модели существует ограничение скорости (количество запросов в минуту, RPM). Подробнее об этих ограничениях см. в разделе «Модели Gemini» .
Запросить увеличение лимита платной ставки
Мы не даем никаких гарантий относительно увеличения вашего лимита скорости, но мы сделаем все возможное, чтобы рассмотреть ваш запрос и свяжемся с вами, если сможем удовлетворить ваши потребности в пропускной способности.