التخزين المؤقت للسياق

في سير عمل الذكاء الاصطناعي النموذجي، يمكنك تمرير رموز الإدخال المميزة نفسها مرارًا وتكرارًا إلى أحد النماذج. باستخدام ميزة التخزين المؤقت للسياق في Gemini API، يمكنك تمرير بعض المحتوى إلى النموذج مرة واحدة وتخزين الرموز المميّزة للإدخال مؤقتًا، ثم الرجوع إلى الرموز المميّزة المخزَّنة مؤقتًا لطلبات لاحقة. في أحجام معيّنة، يكون استخدام الرموز المميّزة المخزَّنة مؤقتًا أقل تكلفة (وقد يكون وقت استجابة أقل) مقارنةً بتمرير مجموعة الرموز المميّزة نفسها بشكل متكرّر.

عند التخزين المؤقت لمجموعة من الرموز المميزة، يمكنك اختيار مدة بقاء ذاكرة التخزين المؤقت قبل أن يتم حذفها تلقائيًا. وتُسمى مدة التخزين المؤقت هذه مدة البقاء (TTL). تعتمد تكلفة التخزين المؤقت على حجم الرمز المميز للإدخال والمدة التي تريد خلالها الاحتفاظ بالرموز المميزة.

يتوافق التخزين المؤقت للسياق مع كل من Gemini 1.5 Pro وGemini 1.5 Flash.

حالات استخدام التخزين المؤقت للسياق

يُعد التخزين المؤقت للسياق مناسبًا بشكل خاص للسيناريوهات التي تتم فيها الإشارة إلى سياق أولي جوهري بشكل متكرر من خلال الطلبات القصيرة. يمكنك استخدام التخزين المؤقت للسياق لحالات الاستخدام مثل:

  • روبوتات دردشة مع تعليمات نظام شاملة
  • تحليل متكرر لملفات الفيديو الطويلة
  • طلبات بحث متكررة مقابل مجموعات كبيرة من المستندات
  • تحليل مستودع الرموز بشكل متكرّر أو إصلاح الأخطاء

كيف يؤدي التخزين المؤقت إلى تقليل التكاليف

التخزين المؤقت للسياق هو ميزة مدفوعة مُصمَّمة لخفض التكاليف التشغيلية الإجمالية. تستند الفوترة إلى العوامل التالية:

  1. عدد الرموز المميّزة لذاكرة التخزين المؤقت: هو عدد الرموز المميّزة للإدخال التي تم تخزينها مؤقتًا، وتتم فوترتها بمعدّل مخفّض عند تضمينها في الطلبات اللاحقة.
  2. مدة التخزين: مقدار الوقت الذي يتم فيه تخزين الرموز المميّزة المخزّنة مؤقتًا (TTL)، وتتم الفوترة كل ساعة. ليس هناك حد أدنى أو أقصى في مدة البقاء.
  3. عوامل أخرى: يتم تطبيق رسوم أخرى، مثل الرموز المميزة للإدخال غير المخزّنة مؤقتًا والرموز المميزة للمخرجات.

للحصول على آخر تفاصيل الأسعار، يُرجى الانتقال إلى صفحة الأسعار في Gemini API. للتعرّف على كيفية احتساب الرموز المميّزة، يمكنك الاطّلاع على دليل الرموز المميّزة.

كيفية استخدام التخزين المؤقت للسياق

يفترض هذا القسم أنّك ثبَّت حزمة تطوير برامج Gemini وضبطت مفتاح واجهة برمجة التطبيقات، كما هو موضّح في مقالة quickstart.

اعتبارات أخرى

يجب مراعاة الاعتبارات التالية عند استخدام التخزين المؤقت للسياق:

  • الحدّ الأدنى لعدد الرموز المميّزة المُدخَلة في التخزين المؤقت للسياق هو 32,768، والحدّ الأقصى هو الحدّ الأقصى للنموذج المحدّد. (لمزيد من المعلومات حول احتساب الرموز المميّزة، راجِع دليل الرموز المميّزة).
  • يمكنك تعيين مدة البقاء (TTL) لذاكرة التخزين المؤقت، كما هو موضح في مثال التعليمة البرمجية. وفي حال تم ترك السياسة بدون ضبط، يتم ضبط القيمة التلقائية على ساعة واحدة.
  • لا يُجري النموذج أي تمييز بين الرموز المميزة المخزنة مؤقتًا والرموز المميزة للإدخال العادية. المحتوى المخبأ هو مجرد بادئة إلى المطالبة.
  • توفر خدمة التخزين المؤقت عملية حذف لإزالة المحتوى يدويًا من ذاكرة التخزين المؤقت. ولمعرفة التفاصيل، يُرجى الاطّلاع على المستندات الخاصة بحزمة SDK التي تختارها.
  • بالنسبة إلى الفئة المدفوعة، ما مِن معدّل خاص أو حدود للاستخدام على التخزين المؤقت حسب السياق، بل يتم تطبيق حدود معدّلة قياسية لـ GenerateContent، وتشمل حدود الرموز المميّزة الرموز المميّزة المخزَّنة مؤقتًا. في الفئة المجانية، يبلغ الحد الأقصى لمساحة التخزين في Gemini 1.5 Flash مليون رمز مميز، ولا تتوفّر ميزة التخزين المؤقت في Gemini 1.5 Pro.
  • لا يمكن استرداد المحتوى المخزَّن مؤقتًا أو الاطّلاع عليه، ولكن يمكنك استرداد البيانات الوصفية (name وdisplay_name وmodel وأوقات الإنشاء والتعديل وانتهاء الصلاحية).
  • ويمكن ضبط ttl أو expire_time جديدة. لا يمكن تغيير أي شيء آخر بشأن المحتوى المخزن مؤقتًا.
  • يتم عرض عدد الرموز المميّزة المخزّنة مؤقتًا في usage_metadata من خلال عمليات الإنشاء والحصول على البيانات وإدراجها في خدمة ذاكرة التخزين المؤقت، وأيضًا في GenerateContent عند استخدام ذاكرة التخزين المؤقت.