في سير عمل الذكاء الاصطناعي النموذجي، يمكنك تمرير رموز الإدخال المميزة نفسها مرارًا وتكرارًا إلى نموذج. باستخدام ميزة التخزين المؤقت للسياق في Gemini API، يمكنك نقل بعض المحتوى إلى النموذج مرة واحدة، وتخزين الرموز المميزة للإدخال مؤقتًا، ثم الرجوع إلى الرموز المميزة المخزّنة مؤقتًا للطلبات اللاحقة. في مجلدات معينة، يكون استخدام الرموز المميزة المخزنة مؤقتًا أقل تكلفة من تمرير مجموعة الرموز المميزة بشكل متكرر
عند تخزين مجموعة من الرموز المميزة مؤقتًا، يمكنك اختيار المدة التي تريد خلالها قبل حذف الرموز المميزة تلقائيًا. مدة التخزين المؤقت هذه تسمى مدة البقاء (TTL). وفي حال تم ترك السياسة بدون ضبط، يتم ضبط القيمة التلقائية على ساعة واحدة. تشير رسالة الأشكال البيانية تعتمد تكلفة التخزين المؤقت على حجم الرمز المميز المُدخل والمدة التي تريد رموز مميزة للاحتفاظ.
يتوافق التخزين المؤقت للسياق مع كل من Gemini 1.5 Pro وGemini 1.5 Flash.
حالات استخدام التخزين المؤقت للسياق
ويُعد التخزين المؤقت للسياق مناسبًا بشكل خاص للسيناريوهات التي تهدد تتم الإشارة إلى السياق الأولي بشكل متكرر من خلال طلبات أقصر. ننصحك باستخدام التخزين المؤقت للسياق لحالات الاستخدام مثل:
- برامج روبوت دردشة مع تعليمات نظام شاملة
- تحليل متكرر لملفات الفيديو الطويلة
- طلبات بحث متكررة مقابل مجموعات كبيرة من المستندات
- تحليل مستودع الرموز بشكل متكرّر أو إصلاح الأخطاء
كيف يؤدي التخزين المؤقت إلى تقليل التكاليف
التخزين المؤقت للسياق هو ميزة مدفوعة مُصمَّمة لخفض التكاليف التشغيلية الإجمالية. تستند الفوترة إلى العوامل التالية:
- عدد الرموز المميزة لذاكرة التخزين المؤقت: عدد الرموز المميزة للإدخال والتي تم تخزينها مؤقتًا، وتتم فوترتها بمعدل منخفض عند تضمينه في الطلبات اللاحقة.
- مدة التخزين: مدة تخزين الرموز المميّزة المخزَّنة مؤقتًا (TTL)، تتم الفوترة استنادًا إلى مدة البقاء (TTL) الخاصة بعدد الرموز المميّزة المخزّنة مؤقتًا. لا يوجد حد أدنى أو الحد الأقصى على TTL.
- عوامل أخرى: يتم تطبيق رسوم أخرى، مثل الرموز المميزة للإدخال غير المخزّنة مؤقتًا والرموز المميزة للمخرجات.
للحصول على تفاصيل الأسعار المعدَّلة، يُرجى الرجوع إلى أسعار Gemini API . لمعرفة كيفية حساب الرموز المميزة، راجع الرمز المميّز الدليل.
كيفية استخدام التخزين المؤقت للسياق
يفترض هذا القسم أنّك ثبَّت حزمة تطوير برامج Gemini وضبطت واجهة برمجة تطبيقات. كما هو موضح في quickstart.
اعتبارات أخرى
يجب مراعاة الاعتبارات التالية عند استخدام التخزين المؤقت للسياق:
- الحد الأدنى لعدد الرموز المميزة للإدخال في التخزين المؤقت للسياق هو 32,768، الحد الأقصى هو الحد الأقصى للنموذج المحدد. (لمزيد من المعلومات حول عدد الرموز المميزة، راجِع دليل الرموز المميّزة).
- لا يُفرّق النموذج بين الرموز المميّزة المخزَّنة مؤقتًا والرموز العادية رموز الإدخال المميزة. المحتوى المخبأ هو مجرد بادئة إلى المطالبة.
- لا يتم فرض قيود على المعدَّل أو الاستخدام في التخزين المؤقت للسياق. المعيار
تنطبق حدود معدّل الضريبة على
GenerateContent
، وتشمل حدود الرموز المميّزة مخزنة مؤقتًا الرموز المميزة. - يتم عرض عدد الرموز المميّزة المخزّنة مؤقتًا في
usage_metadata
من وإنشاء عمليات خدمة ذاكرة التخزين المؤقت والحصول عليها وإدراجها فيGenerateContent
عند استخدام ذاكرة التخزين المؤقت.