В этом руководстве представлен обзор различных вариантов выставления счетов Gemini API, объясняется, как включить выставление счетов и отслеживать использование, а также представлены ответы на часто задаваемые вопросы (FAQ) о выставлении счетов.
О выставлении счетов
Выставление счетов за Gemini API основано на двух ценовых уровнях: бесплатно (или бесплатно ) и с оплатой по мере использования (или платно ). Цены и лимиты ставок различаются в зависимости от этих уровней, а также в зависимости от модели. Текущие цены и ограничения тарифов см. в разделе «Цены» . Подробную информацию о возможностях каждой модели см. на странице моделей Gemini .
Ограничения ставок
Ограничения скорости — это квоты , которые ограничивают количество запросов или токенов, которые вы можете отправить в Gemini API в заданном временном окне. Ограничения скорости могут применяться к каждому запросу или к каждому токену. Вот вымышленный пример квот, которые могут применяться к данной модели на данном уровне:
- 10 об/мин (запросов в минуту)
- 10 000 TPM (токенов в минуту)
- 1000 RPD (запросов в день)
В этом примере, если вы превысите 10 об/мин (или 10 000 доверенных/об/мин или 1 000 об/мин), служба Gemini API выдаст ошибку 429: RESOURCE_EXHAUSTED
, указывающую, что вы превысили ограничение скорости.
Зачем использовать платный уровень?
Когда вы включаете выставление счетов и используете платный уровень, вы получаете более высокие лимиты ставок, а ваши подсказки и ответы не используются для улучшения продуктов Google. Дополнительную информацию об использовании данных для платных услуг см. в условиях обслуживания .
Облачный биллинг
Gemini API использует Cloud Billing для выставления счетов за услуги. Чтобы использовать платный уровень, вам необходимо настроить Cloud Billing в своем облачном проекте. После включения Cloud Billing вы можете использовать инструменты Cloud Billing для отслеживания расходов, анализа затрат, осуществления платежей и доступа к поддержке Cloud Billing.
Включить биллинг
Вы можете включить Cloud Billing, начиная с Google AI Studio:
Откройте Google AI Studio .
В нижней части левой боковой панели выберите «Настройки» > «Информация о плане» .
Нажмите «Настроить биллинг» для выбранного проекта, чтобы включить биллинг в облаке.
Мониторинг использования
После включения Cloud Billing вы сможете отслеживать использование Gemini API в консоли Google Cloud . Имя сервиса для API — generativelanguage.googleapis.com
, а в консоли API Gemini также называется API генеративного языка .
Дополнительную информацию см. в документации Google Cloud по мониторингу использования API .
Часто задаваемые вопросы
В этом разделе представлены ответы на часто задаваемые вопросы.
За что мне выставлен счет?
Цены на Gemini API основаны на следующем:
- Входное количество токенов
- Количество выходных токенов
- Количество кэшированных токенов
- Продолжительность хранения кэшированного токена
Информацию о ценах смотрите на странице цен .
Где я могу просмотреть свою квоту?
Вы можете просмотреть свою квоту и системные ограничения в консоли Google Cloud .
Могу ли я бесплатно использовать Gemini API в ЕЭЗ (включая ЕС), Великобритании и Швейцарии?
Да, мы делаем бесплатный и платный уровни доступными во многих регионах .
Если я настрою выставление счетов с помощью Gemini API, будет ли с меня взиматься плата за использование Google AI Studio?
Нет, использование Google AI Studio остается бесплатным независимо от того, настроены ли вы выставление счетов во всех поддерживаемых регионах.
Могу ли я использовать токены 1M на бесплатном уровне?
Уровень бесплатного пользования Gemini API различается в зависимости от выбранной модели. На данный момент вы можете попробовать контекстное окно токена 1M следующими способами:
- В Google AI Studio
- С оплатой по мере использования
- С бесплатными планами для некоторых моделей
Последние ограничения по бесплатным тарифам для каждой модели можно найти на странице цен .
Как я могу подсчитать количество токенов, которые я использую?
Используйте метод GenerativeModel.count_tokens
для подсчета количества токенов. Обратитесь к руководству по токенам, чтобы узнать больше о токенах.
Могу ли я использовать свои кредиты Google Cloud с API Gemini?
Да, кредиты Google Cloud можно использовать для использования Gemini API.
Как осуществляется выставление счетов?
Выставление счетов за Gemini API осуществляется системой Cloud Billing .
Взимается ли с меня плата за невыполненные запросы?
Если ваш запрос не будет выполнен с ошибкой 400 или 500, с вас не будет взиматься плата за использованные токены. Однако запрос все равно будет учитываться в вашей квоте.
Взимается ли плата за доработку моделей?
Настройка модели бесплатна, но за вывод по настроенным моделям взимается та же плата, что и за базовые модели.
Взимается ли плата за GetTokens?
За запросы к API GetTokens не взимается плата и они не учитываются в квоте вывода.
Где я могу получить помощь по оплате?
Чтобы получить помощь по выставлению счетов, см. раздел «Получите поддержку Cloud Billing» .
,В этом руководстве представлен обзор различных вариантов выставления счетов Gemini API, объясняется, как включить выставление счетов и отслеживать использование, а также представлены ответы на часто задаваемые вопросы (FAQ) о выставлении счетов.
О выставлении счетов
Выставление счетов за Gemini API основано на двух ценовых уровнях: бесплатно (или бесплатно ) и с оплатой по мере использования (или платно ). Цены и ограничения по ставкам различаются в зависимости от этих уровней, а также в зависимости от модели. Текущие цены и ограничения тарифов см. в разделе «Цены» . Подробную информацию о возможностях каждой модели см. на странице моделей Gemini .
Ограничения ставок
Ограничения скорости — это квоты , которые ограничивают количество запросов или токенов, которые вы можете отправить в Gemini API в заданном временном окне. Ограничения скорости могут применяться для каждого запроса или для каждого токена. Вот вымышленный пример квот, которые могут применяться к данной модели на данном уровне:
- 10 об/мин (запросов в минуту)
- 10 000 TPM (токенов в минуту)
- 1000 RPD (запросов в день)
В этом примере, если вы превысите 10 об/мин (или 10 000 доверенных/об/мин или 1 000 об/мин), служба Gemini API выдаст ошибку 429: RESOURCE_EXHAUSTED
, указывающую, что вы превысили ограничение скорости.
Зачем использовать платный уровень?
Когда вы включаете выставление счетов и используете платный уровень, вы получаете более высокие лимиты ставок, а ваши подсказки и ответы не используются для улучшения продуктов Google. Дополнительную информацию об использовании данных для платных услуг см. в условиях обслуживания .
Облачный биллинг
Gemini API использует Cloud Billing для выставления счетов за услуги. Чтобы использовать платный уровень, вам необходимо настроить Cloud Billing в своем облачном проекте. После включения Cloud Billing вы можете использовать инструменты Cloud Billing для отслеживания расходов, анализа затрат, осуществления платежей и доступа к поддержке Cloud Billing.
Включить биллинг
Вы можете включить Cloud Billing, начиная с Google AI Studio:
Откройте Google AI Studio .
В нижней части левой боковой панели выберите «Настройки» > «Информация о плане» .
Нажмите «Настроить биллинг» для выбранного проекта, чтобы включить биллинг в облаке.
Мониторинг использования
После включения Cloud Billing вы сможете отслеживать использование Gemini API в консоли Google Cloud . Имя сервиса для API — generativelanguage.googleapis.com
, а в консоли Gemini API также называется Generative Language API .
Дополнительную информацию см. в документации Google Cloud по мониторингу использования API .
Часто задаваемые вопросы
В этом разделе представлены ответы на часто задаваемые вопросы.
За что мне выставлен счет?
Цены на Gemini API основаны на следующем:
- Входное количество токенов
- Количество выходных токенов
- Количество кэшированных токенов
- Продолжительность хранения кэшированного токена
Информацию о ценах смотрите на странице цен .
Где я могу просмотреть свою квоту?
Вы можете просмотреть свою квоту и системные ограничения в консоли Google Cloud .
Могу ли я бесплатно использовать Gemini API в ЕЭЗ (включая ЕС), Великобритании и Швейцарии?
Да, мы делаем бесплатный и платный уровни доступными во многих регионах .
Если я настрою выставление счетов с помощью Gemini API, будет ли с меня взиматься плата за использование Google AI Studio?
Нет, использование Google AI Studio остается бесплатным независимо от того, настроены ли вы выставление счетов во всех поддерживаемых регионах.
Могу ли я использовать токены 1M на бесплатном уровне?
Уровень бесплатного пользования Gemini API различается в зависимости от выбранной модели. На данный момент вы можете попробовать контекстное окно токена 1M следующими способами:
- В Google AI Studio
- С оплатой по факту использования
- С бесплатными планами для некоторых моделей
Последние ограничения по бесплатным тарифам для каждой модели можно найти на странице цен .
Как я могу подсчитать количество токенов, которые я использую?
Используйте метод GenerativeModel.count_tokens
для подсчета количества токенов. Обратитесь к руководству по токенам, чтобы узнать больше о токенах.
Могу ли я использовать свои кредиты Google Cloud с API Gemini?
Да, кредиты Google Cloud можно использовать для использования Gemini API.
Как осуществляется выставление счетов?
Выставление счетов за Gemini API осуществляется системой Cloud Billing .
Взимается ли с меня плата за невыполненные запросы?
Если ваш запрос не будет выполнен с ошибкой 400 или 500, с вас не будет взиматься плата за использованные токены. Однако запрос все равно будет учитываться в вашей квоте.
Взимается ли плата за доработку моделей?
Настройка модели бесплатна, но за вывод по настроенным моделям взимается та же плата, что и за базовые модели.
Взимается ли плата за GetTokens?
За запросы к API GetTokens не взимается плата и они не учитываются в квоте вывода.
Где я могу получить помощь по оплате?
Чтобы получить помощь по выставлению счетов, см. раздел «Получить поддержку Cloud Billing» .