このガイドでは、Gemini API のさまざまなお支払いオプションの概要を説明します。 課金を有効にして使用状況をモニタリングする方法と、 お支払いに関するよくある質問(FAQ)をご覧ください。
お支払いについて
Gemini API の料金は、無料の 2 つの料金ティアに基づいて請求されます。 (または無料)と従量課金制(有料)があります。料金とレート制限が異なる モデルによって異なります。現在の料金とレート制限については 料金をご覧ください。モデルごとの機能の内訳については、以下をご覧ください。 Gemini モデルのページ。
レート制限
レート制限とは、特定のサービスに対する割り当てのことです 使用して、Gemini API に送信できるリクエストまたはトークンの数を 表示されます。レート制限はリクエストごと、またはトークンごとに適用されます。こちらが 特定の階層の特定のモデルに適用される割り当ての架空の例を次に示します。
- 10 RPM(1 分あたりのリクエスト数)
- 10,000 TPM(1 分あたりのトークン数)
- 1,000 RPD(1 日あたりのリクエスト数)
この例では、10 RPM(または 10,000 TPM または 1,000 RPD)を超える場合、
Gemini API サービスが 429: RESOURCE_EXHAUSTED
エラーをスローする
超えていることを示します。
有料階層を使用する理由
課金を有効にして有料階層を使用すると、 メッセージと回答が Google サービスの改善に使用されることはありません。 有料サービスのデータ使用について詳しくは、 利用規約が適用されます。
Cloud Billing
Gemini API は Cloud Billing 課金サービスも提供しています有料階層を使用するには、Cloud Billing を設定する必要があります。 作成します。Cloud Billing を有効にすると、Cloud Billing を 支出の追跡、費用の把握、支払い、アクセスを行うための請求ツール Cloud Billing のサポート。
課金を有効にする
Cloud Billing は Google AI Studio から有効にできます。
Google AI Studio を開きます。
左側のサイドバーの下部にある [設定] > プラン情報。
選択したプロジェクトの [お支払い情報を設定] をクリックして、Cloud Billing を有効にします。
使用量のモニタリング
Cloud Billing を有効にすると、Gemini API の使用状況を
Google Cloud コンソール。
API のサービス名は generativelanguage.googleapis.com
で、
Gemini API は Generative Language API とも呼ばれます。
詳細については、このモジュールのコースリソースに Monitoring API の使用状況。
よくある質問
このセクションでは、よくある質問とその回答を紹介します。
請求対象
Gemini API の料金は以下に基づきます。
- 入力トークン数
- 出力トークン数
- キャッシュに保存されたトークン数
- キャッシュに保存されたトークンの保存期間
料金については、料金ページをご覧ください。
割り当てはどこで確認できますか?
割り当てとシステムの上限は、 Google Cloud コンソール。
EEA(EU を含む)、英国、スイスで Gemini API を無料で使用できますか?
API では、次の 2 つのモデルセットを使用できます。
- Gemini 1.5 Flash、Gemini 1.5 Pro、Gemini 1.0 を含む有料モデル プロ。これらのモデルには、EEA で利用できる無料枠はありません( EU)、英国、スイス)。デベロッパーは必要な手順を踏む必要がある 請求先アカウントを設定し、使用料を支払います。
- 特定のモデルには、Gemini API で無料でアクセスできる場合があります。(参照: ai.google.dev/pricing: 課金対象のモデルの詳細 他のモデルは無料です)。支払いと請求の設定が必要です モデルを使用することになります
Gemini API でお支払い情報を設定すると、Google AI Studio の利用に対して課金されますか?
いいえ。設定したかどうかにかかわらず、Google AI Studio は引き続き無料でご利用いただけます。 EEA、EU、英国、スイスを含むすべてのサポートされている地域における請求。
無料枠で 100 万トークンを使用できますか?
Gemini API の無料枠は、選択したモデルによって異なります。現時点では、 次の方法で 100 万トークンのコンテキスト ウィンドウを試すことができます。
- Google AI Studio
- 従量課金制プラン
- 一部のモデルを対象とした無料プランあり
モデルごとの最新の無料レート制限については、 料金ページをご覧ください。
使用しているトークンの数を計算するにはどうすればよいですか?
GenerativeModel.count_tokens
を使用する
メソッドを使用してトークンの数をカウントします。詳しくは、
トークンの詳細については、トークンガイドをご覧ください。
請求はどのように処理されますか?
Gemini API の請求は、 Cloud Billing システム。
リクエストが失敗した場合に課金されますか?
リクエストが 400 エラーまたは 500 エラーで失敗した場合、 表示されます。ただし、リクエストは引き続き割り当てにカウントされます。
モデルのファインチューニングには費用がかかりますか?
モデルのチューニングは無料だが、チューニング 基本モデルと同じレートで課金されます
GetTokens は課金されますか?
GetTokens API へのリクエストは課金されず、 推論の割り当て。
請求に関するサポートはどこで受けられますか?
お支払いとご請求については、以下をご覧ください。 Cloud Billing のサポートを利用する