تخزين السياق مؤقتًا

في سير عمل الذكاء الاصطناعي النموذجي، قد تُمرِّر الرموز المميّزة نفسها للإدخال مرارًا وتكرارًا إلى أحد النماذج. توفّر Gemini API ميزة التخزين المؤقت الضمني لتحسين الأداء والتكاليف.

التخزين المؤقت الضمني

يتم تفعيل التخزين المؤقت الضمني تلقائيًا لجميع نماذج Gemini 2.5 والإصدارات الأحدث. ننقل تلقائيًا وفورات التكلفة إذا كان طلبك يطابق البيانات المخزّنة مؤقتًا. ليس عليك اتّخاذ أي إجراء لتفعيل هذه الميزة. يتم إدراج الحد الأدنى لعدد الرموز المميّزة للإدخال من أجل تخزين السياق مؤقتًا في الجدول التالي لكل نموذج:

الطراز الحد الأدنى للرموز المميّزة
‫Gemini 3 Flash (معاينة) 1024
‫Gemini 3 Pro (معاينة) 4096
Gemini 2.5 Flash 1024
Gemini 2.5 Pro 4096

لزيادة فرصة مطابقة البيانات المخزّنة مؤقتًا ضمنيًا:

  • حاوِل وضع المحتويات الكبيرة والشائعة في بداية طلبك
  • حاوِل إرسال طلبات تتضمّن بادئة مشابهة خلال فترة قصيرة

يمكنك الاطّلاع على عدد الرموز المميّزة التي طابقت البيانات المخزّنة مؤقتًا في حقل usage_metadata (بايثون) أو usageMetadata (JavaScript) في عنصر الاستجابة.