Google uses AI technology to translate content into your preferred language. AI translations can contain errors.
コンテキストのキャッシュ保存
一般的な AI ワークフローでは、同じ入力トークンをモデルに繰り返し渡すことがあります。Gemini API は、パフォーマンスと費用を最適化するために暗黙的なキャッシュ保存を提供します。
暗黙的なキャッシュ保存
Gemini 2.5 以降のすべてのモデルでは、暗黙的キャッシュ保存がデフォルトで有効になっています。リクエストがキャッシュにヒットした場合、費用削減が自動的に適用されます。有効にするために必要な操作はありません。次の表に、各モデルのコンテキスト キャッシュ保存の最小入力トークン数を示します。
| モデル |
最小トークン数 |
| Gemini 3 Flash プレビュー |
1024 |
| Gemini 3 Pro プレビュー版 |
4096 |
| Gemini 2.5 Flash |
1024 |
| Gemini 2.5 Pro |
4096 |
暗黙的なキャッシュ ヒットの可能性を高めるには:
- 大規模で一般的なコンテンツは、プロンプトの先頭に配置します。
- 類似した接頭辞を含むリクエストを短時間で送信しようとします。
キャッシュ ヒットしたトークンの数は、レスポンス オブジェクトの usage_metadata(Python)または usageMetadata(JavaScript)フィールドで確認できます。
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2026-05-07 UTC。
[[["わかりやすい","easyToUnderstand","thumb-up"],["問題の解決に役立った","solvedMyProblem","thumb-up"],["その他","otherUp","thumb-up"]],[["必要な情報がない","missingTheInformationINeed","thumb-down"],["複雑すぎる / 手順が多すぎる","tooComplicatedTooManySteps","thumb-down"],["最新ではない","outOfDate","thumb-down"],["翻訳に関する問題","translationIssue","thumb-down"],["サンプル / コードに問題がある","samplesCodeIssue","thumb-down"],["その他","otherDown","thumb-down"]],["最終更新日 2026-05-07 UTC。"],[],[]]