Gemini 1.5 Flash の値下げ、すべてのデベロッパー向けのファインチューニング アクセスなど
詳細
フィードバックを送信
コンテキスト キャッシュ
コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
<ph type="x-smartling-placeholder"></ph>
Python
Node.js
移動
一般的な AI ワークフローでは、同じ入力トークンを
モデルです。Gemini API のコンテキスト キャッシュ機能を使用すると、コンテンツの一部を
入力トークンをキャッシュに保存してから、キャッシュに保存されているトークンを参照する
使用します。特定のボリュームでは、キャッシュされたトークンを使用すると費用が抑えられる
同じトークンのコーパスを繰り返し渡すより効率的です。
一連のトークンをキャッシュに保存する場合は、
存在する必要があります。このキャッシュ保存期間は
これは有効期間 (TTL)と呼ばれます。設定しない場合、TTL はデフォルトで 1 時間になります。「
キャッシュ保存の費用は、入力トークンのサイズと、
維持します。
コンテキスト キャッシュは、Gemini 1.5 Pro と Gemini 1.5 Flash の両方をサポートしています。
注: コンテキスト キャッシュは、修正済みバージョンの安定したモデルでのみ使用できます。
(例: gemini-1.5-pro-001
)。バージョンの接尾辞(
たとえば、gemini-1.5-pro-001
の -001
など)。
コンテキスト キャッシュ保存を使用する状況
コンテキスト キャッシュ保存は、初期コンテキストの実体部分が、短いリクエストで繰り返し参照されるシナリオに特に適しています。次のようなユースケースでは、コンテキスト キャッシュ保存の使用を検討してください。
広範なシステム指示 を行う chatbot
長時間の動画ファイルの繰り返し分析
大規模なドキュメント セットに対する繰り返しのクエリ
頻繁なコード リポジトリの分析やバグ修正
キャッシュ保存によって費用が削減される仕組み
コンテキスト キャッシュ保存は、全体的な運用コストを削減するために設計された有料の機能です。ご請求は次の項目に基づいて行われます。
キャッシュ トークン数: キャッシュに保存された入力トークンの数。後続のプロンプトに含まれる場合は、割引料金で請求されます。
保存期間: キャッシュに保存されたトークンの保存期間(TTL)です。
キャッシュされたトークン数の TTL 期間に基づいて課金されます。最低料金なし
TTL の上限を指定しています
その他の項目: 入力トークンや出力トークンがキャッシュされていない場合などは、別の料金が適用されます。
最新の料金の詳細については、Gemini API の料金をご覧ください。
ページをご覧ください 。トークンのカウント方法については、トークン
ガイド をご覧ください。
コンテキスト キャッシュの使用方法
このセクションでは、Gemini SDK がインストールされ、API が構成済みであることを前提としています。
鍵を作成します(クイックスタート をご覧ください)。
その他の考慮事項
コンテキスト キャッシュを使用する場合は、次の点に注意してください。
コンテキスト キャッシュの最小 入力トークン数は 32,768 で、
max は、特定のモデルの最大値と同じです。(
トークン ガイド をご覧ください)。
このモデルでは、キャッシュされたトークンと通常のトークンは区別されません。
使用します。キャッシュに保存されたコンテンツはプロンプトの接頭辞です。
コンテキスト キャッシュに特別なレートや使用量上限はありません。標準
GenerateContent
のレート制限が適用されます。トークンの制限にはキャッシュが含まれます
使用します。
キャッシュに保存されたトークンの数は、usage_metadata
に
キャッシュ サービスの作成、取得、一覧表示の操作のほか、
キャッシュを使用する場合、GenerateContent
。
フィードバックを送信
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンス により使用許諾されます。コードサンプルは Apache 2.0 ライセンス により使用許諾されます。詳しくは、Google Developers サイトのポリシー をご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2024-09-09 UTC。
[{
"type": "thumb-down",
"id": "missingTheInformationINeed",
"label":"必要な情報がない"
},{
"type": "thumb-down",
"id": "tooComplicatedTooManySteps",
"label":"複雑すぎる / 手順が多すぎる"
},{
"type": "thumb-down",
"id": "outOfDate",
"label":"最新ではない"
},{
"type": "thumb-down",
"id": "translationIssue",
"label":"翻訳に関する問題"
},{
"type": "thumb-down",
"id": "samplesCodeIssue",
"label":"サンプル / コードに問題がある"
},{
"type": "thumb-down",
"id": "otherDown",
"label":"その他"
}]
[{
"type": "thumb-up",
"id": "easyToUnderstand",
"label":"わかりやすい"
},{
"type": "thumb-up",
"id": "solvedMyProblem",
"label":"問題の解決に役立った"
},{
"type": "thumb-up",
"id": "otherUp",
"label":"その他"
}]
ご意見をお聞かせください
{"lastModified": "\u6700\u7d42\u66f4\u65b0\u65e5 2024-09-09 UTC\u3002"}
[[["わかりやすい","easyToUnderstand","thumb-up"],["問題の解決に役立った","solvedMyProblem","thumb-up"],["その他","otherUp","thumb-up"]],[["必要な情報がない","missingTheInformationINeed","thumb-down"],["複雑すぎる / 手順が多すぎる","tooComplicatedTooManySteps","thumb-down"],["最新ではない","outOfDate","thumb-down"],["翻訳に関する問題","translationIssue","thumb-down"],["サンプル / コードに問題がある","samplesCodeIssue","thumb-down"],["その他","otherDown","thumb-down"]],["最終更新日 2024-09-09 UTC。"],[],[]]