التخزين المؤقت للسياق

في سير عمل نموذجي للذكاء الاصطناعي، قد يتم تمرير الرموز المميزة نفسها بشكل متكرر إلى أحد النماذج. توفّر Gemini API التخزين المؤقت الضمني لتحسين الأداء والتكاليف.

التخزين المؤقت الضمني

يتم تفعيل التخزين المؤقت الضمني تلقائيًا لجميع نماذج Gemini 2.5 والإصدارات الأحدث. ننقل تلقائيًا عروض التوفير في التكاليف إذا وصل طلبك إلى ذاكرات التخزين المؤقت. ليس عليك اتّخاذ أي إجراء لتفعيل هذه الميزة. يتم إدراج الحد الأدنى لعدد الرموز المميزة للإدخال المطلوب لتخزين السياق مؤقتًا في الجدول التالي لكل نموذج:

الطراز الحد الأدنى لعدد الرموز المميزة
Gemini 3.5 Flash 4096
معاينة Gemini 3.1 Pro 4096
Gemini 2.5 Flash 2048
Gemini 2.5 Pro 2048

لزيادة فرصة حدوث نتيجة ذاكرة التخزين المؤقت الضمنية، اتّبِع الخطوات التالية:

  • جرِّب وضع المحتوى الكبير والشائع في بداية طلبك
  • محاولة إرسال طلبات تتضمّن بادئة مشابهة خلال فترة زمنية قصيرة

يمكنك الاطّلاع على عدد الرموز المميزة التي تم العثور عليها في ذاكرة التخزين المؤقت في الحقل usage_metadata (Python) أو usageMetadata (JavaScript) ضمن عنصر الاستجابة.