التخزين المؤقت للسياق

في سير عمل الذكاء الاصطناعي النموذجي، قد تُمرِّر الرموز المميّزة نفسها للإدخال بشكل متكرّر إلى أحد النماذج. توفّر Gemini API التخزين المؤقت الضمني لتحسين الأداء والتكاليف.

التخزين المؤقت الضمني

يتم تفعيل التخزين المؤقت الضمني تلقائيًا لجميع نماذج Gemini 2.5 والإصدارات الأحدث. ننقل تلقائيًا وفورات التكلفة إذا وصل طلبك إلى البيانات المخزّنة مؤقتًا. ليس عليك اتّخاذ أي إجراء لتفعيل هذه الميزة. يتم إدراج الحد الأدنى لعدد الرموز المميّزة للإدخال من أجل التخزين المؤقت للسياق في الجدول التالي لكل نموذج:

الطراز الحد الأدنى للرموز المميّزة
Gemini 3.5 Flash 1024
Gemini 3 Pro Preview 4096
Gemini 2.5 Flash 1024
Gemini 2.5 Pro 4096

لزيادة فرصة نتيجة ذاكرة التخزين المؤقت الضمنية:

  • حاوِل وضع المحتويات الكبيرة والشائعة في بداية طلبك
  • حاوِل إرسال الطلبات التي تتضمّن بادئة مشابهة خلال فترة قصيرة

يمكنك الاطّلاع على عدد الرموز المميّزة التي تم الوصول إليها من البيانات المخزّنة مؤقتًا في حقل usage_metadata (في Python) أو usageMetadata (في JavaScript) في عنصر الاستجابة.