واجهة Interactions API
إذا كنت تستخدم حاليًا واجهة برمجة التطبيقات الكلاسيكية generateContent، توفّر Interactions API الجديدة مسار ترقية فعّالًا لتطبيقاتك. ننصح باستخدامها في جميع المشاريع الجديدة، وهي محسّنة لعمليات سير العمل المستندة إلى الوكلاء وإدارة الحالة من جهة الخادم والمحادثات المعقّدة المتعددة الوسائط والمتعددة الأدوار. ستظلّ واجهة برمجة التطبيقات الأصلية generateContent متوافقة تمامًا.
لماذا يجب استخدام Interactions API؟
- إدارة السجلّ من جهة الخادم: تبسيط مسارات المحادثات المتعددة الأدوار من خلال
previous_interaction_idيتم تفعيل الحالة تلقائيًا على الخادم (store=true)، ولكن يمكنك اختيار السلوك غير المرتبط بحالة من خلال ضبطstore=false. - خطوات التنفيذ القابلة للمراقبة: تسهّل الخطوات المكتوبة تصحيح الأخطاء في التدفقات المعقّدة وعرض واجهة المستخدم للأحداث الوسيطة (مثل الأفكار أو أدوات البحث).
- مصمَّمة لتنفيذ المهام المستندة إلى الذكاء الاصطناعي الوكيل: تتوافق هذه المنصة بشكلٍ كامل مع استخدام الأدوات المتعددة الخطوات والتنسيق وتدفقات التفكير المعقّدة من خلال خطوات التنفيذ المكتوبة.
- المهام الطويلة والمهام التي يتم تنفيذها في الخلفية: تتيح نقل العمليات التي تستغرق وقتًا طويلاً، مثل Deep Think وDeep Research، إلى العمليات التي يتم تنفيذها في الخلفية باستخدام
background=true. - الوصول إلى النماذج والإمكانات الجديدة: من الآن فصاعدًا، سيتم إطلاق النماذج الجديدة التي تتجاوز عائلة النماذج الأساسية، بالإضافة إلى الإمكانات والأدوات الجديدة بالذكاء الاصطناعي الوكيل، حصريًا على Interactions API.
استخدِم Interactions API إذا كنت تبدأ مشروعًا جديدًا أو تنشئ تطبيقات مستندة إلى وكيل أو تحتاج إلى إدارة المحادثات من جهة الخادم. استخدِم generateContent إذا كان لديك عملية دمج حالية تناسب احتياجاتك، أو إذا كنت بحاجة إلى ميزة غير متاحة بعد في Interactions API، مثل Batch API أو التخزين المؤقت الصريح.
البدء
- إعداد وكيل الترميز: اربط وكيلك ببروتوكول MCP في "مستندات Gemini" وثبِّت مهارة
gemini-interactions-apiلمنح مساعدك إذن الوصول المباشر إلى أحدث مستندات المطوّرين وأفضل الممارسات. إعداد وكيل الترميز → - نقل البيانات من
generateContent: إذا كان لديك عملية دمج حالية، اتّبِع دليل نقل البيانات للانتقال إلى Interactions API. - تجربة التشغيل السريع: ابدأ باستخدام مثال بسيط يعمل في دليل التشغيل السريع لواجهة Interactions API.
أدلة الميزات
يمكنك استكشاف الإمكانات المحدّدة لواجهة برمجة التطبيقات Interactions API من خلال هذه الأدلة. يمكنك استخدام زر التبديل في هذه الصفحات للتبديل بين generateContent وInteractions API:
- إنشاء النصوص
- إنشاء الصور
- فهم الصور
- فهم الصوت
- فهم الفيديو
- معالجة المستندات
- استدعاء الدوال
- الناتج المنظَّم
- وكيل Deep Research
- الاستدلال المرن
- استنتاج الأولوية
- بث
طريقة عمل Interactions API
تتمحور واجهة Interactions API حول مورد أساسي هو Interaction. يمثّل Interaction دورة كاملة في محادثة أو مهمة. يعمل هذا السجلّ كسجلّ جلسة، ويحتوي على السجلّ الكامل للتفاعل كسلسلة زمنية من خطوات التنفيذ. تشمل هذه الخطوات أفكار النموذج، وعمليات استدعاء الأدوات ونتائجها من جهة الخادم أو العميل (مثل function_call وfunction_result)، وmodel_output النهائي. يتضمّن المرجع المخزّن (الذي يتم استرجاعه من خلال interactions.get) أيضًا خطوات user_input للحصول على السياق الكامل، على الرغم من أنّ استجابة interactions.create تعرض فقط الخطوات التي أنشأها النموذج.
عند إجراء طلب إلى
interactions.create، فإنّك
تنشئ مورد Interaction جديدًا.
الوصول إلى النتائج باستخدام خصائص سهلة الاستخدام في حزمة SDK
على الرغم من أنّ Interactions API تعرض مخططًا زمنيًا منظَّمًا لخطوات التنفيذ (مثل الأفكار وطلبات البحث واستدعاء الدوال)، ليس عليك الانتقال يدويًا بين الخطوات للحصول على الرد النهائي من النموذج.
توفّر حِزم تطوير البرامج (SDK) من Google للذكاء الاصطناعي التوليدي خصائص ملائمة مباشرةً في عنصر Interaction الذي يتم عرضه للوصول إلى النواتج الخاصة بالوسائط المختلفة:
| السمة المريحة لحزمة تطوير البرامج (SDK) | نوع القيمة التي يتم عرضها | Description |
|---|---|---|
interaction.output_text |
سلسلة | تعرض هذه السمة آخر كتل نصية في ردّ النموذج. إذا تم تقسيم الرد على عدة كتل TextContent متتالية، سيتم ربطها تلقائيًا. لا يتضمّن هذا القسم كتل نصية سابقة مفصولة بمحتوى غير نصي (مثل الأفكار أو الصور أو المحتوى الصوتي أو طلبات استخدام الأدوات). بالنسبة إلى الردود المعقّدة أو المتداخلة المتعدّدة الوسائط، عليك تكرار steps يدويًا بدلاً من ذلك. |
interaction.output_image |
ImageContent أو None |
تعرض هذه السمة آخر كتلة صور أنشأها النموذج في الطلب الحالي. |
interaction.output_audio |
AudioContent أو None |
تعرض هذه السمة آخر مقطع صوتي أنشأه النموذج في الطلب الحالي. |
بالنسبة إلى حالات الاستخدام المتقدّمة، مثل عرض عمليات التفكير الوسيطة أو فحص عمليات استدعاء الأدوات خطوة بخطوة أو تصحيح الأخطاء، يمكنك مواصلة فحص مخطط interaction.steps الزمني الأولي وتصفّحه يدويًا.
إدارة الحالة من جهة الخادم
يمكنك استخدام id لتفاعل مكتمل في مكالمة لاحقة باستخدام المَعلمة previous_interaction_id لمواصلة المحادثة. يستخدم الخادم هذا المعرّف لاسترداد سجلّ المحادثات، ما يوفّر عليك عناء إعادة إرسال سجلّ المحادثات بأكمله.
تحتفظ المَعلمة previous_interaction_id بسجلّ المحادثات فقط (المدخلات والمخرجات) باستخدام previous_interaction_id. المَعلمات الأخرى محدودة بنطاق التفاعل
ولا تنطبق إلا على التفاعل المحدّد الذي يتم إنشاؤه حاليًا:
toolssystem_instruction-
generation_config(بما في ذلكthinking_levelوtemperatureوما إلى ذلك)
وهذا يعني أنّه عليك إعادة تحديد هذه المَعلمات في كل تفاعل جديد إذا كنت تريد تطبيقها. إدارة الحالة من جهة الخادم هي إجراء اختياري، ويمكنك أيضًا التشغيل في وضع بلا حالة من خلال إرسال سجلّ المحادثة الكامل في كل طلب.
تخزين البيانات والاحتفاظ بها
تخزّن واجهة برمجة التطبيقات تلقائيًا جميع عناصر Interaction (store=true) بهدف تسهيل استخدام ميزات إدارة الحالة من جهة الخادم (باستخدام previous_interaction_id) والتنفيذ في الخلفية (باستخدام background=true) ولأغراض إمكانية تتبّع البيانات.
- المستوى المدفوع: يحتفظ النظام بالتفاعلات لمدة 55 يومًا.
- المستوى المجاني: يحتفظ النظام بالتفاعلات لمدة يوم واحد.
إذا كنت لا تريد ذلك، يمكنك ضبط store=false في طلبك. يتم فصل عنصر التحكّم هذا عن إدارة الحالة، ويمكنك إيقاف مساحة التخزين لأي تفاعل. يُرجى العِلم أنّ store=false لا يتوافق مع background=true ويمنع استخدام previous_interaction_id في الأدوار اللاحقة.
يمكنك حذف التفاعلات المخزّنة في أي وقت باستخدام طريقة الحذف المتوفّرة في مرجع واجهة برمجة التطبيقات. لا يمكنك حذف التفاعلات إلا إذا كنت تعرف رقم تعريف التفاعل.
وبعد انتهاء صلاحية فترة التخزين، سيتم حذف بياناتك تلقائيًا.
يعالج النظام عناصر التفاعل وفقًا للبنود.
أفضل الممارسات
- نسبة نتيجة ذاكرة التخزين المؤقت: يتيح استخدام
previous_interaction_idلمواصلة المحادثات للنظام الاستفادة بسهولة أكبر من التخزين المؤقت الضمني لسجلّ المحادثات، ما يحسّن الأداء ويقلّل التكاليف. - مزج التفاعلات: يمكنك مزج التفاعلات بين الوكيل والنموذج ومطابقتها ضمن محادثة واحدة. على سبيل المثال، يمكنك استخدام وكيل متخصص، مثل وكيل "البحث المعمّق"، لجمع البيانات الأولية، ثم استخدام نموذج Gemini عادي لتنفيذ مهام المتابعة، مثل التلخيص أو إعادة التنسيق، وربط هذه الخطوات باستخدام
previous_interaction_id.
الطُرز والوكلاء المتوافقون
| اسم النموذج | النوع | رقم تعريف الطراز |
|---|---|---|
| Gemini 3.5 Flash | الطراز | gemini-3.5-flash |
| Gemini 3.1 Flash-Lite | الطراز | gemini-3.1-flash-lite |
| معاينة Gemini 3.1 Pro | الطراز | gemini-3.1-pro-preview |
| معاينة Gemini 3 Flash | الطراز | gemini-3-flash-preview |
| Gemini 2.5 Pro | الطراز | gemini-2.5-pro |
| Gemini 2.5 Flash | الطراز | gemini-2.5-flash |
| Gemini 2.5 Flash-lite | الطراز | gemini-2.5-flash-lite |
| معاينة مقطع Lyria 3 | الطراز | lyria-3-clip-preview |
| معاينة Lyria 3 Pro | الطراز | lyria-3-pro-preview |
| معاينة Deep Research | الوكيل | deep-research-pro-preview-12-2025 |
| معاينة Deep Research | الوكيل | deep-research-preview-04-2026 |
| معاينة Deep Research | الوكيل | deep-research-max-preview-04-2026 |
حزم SDK
يمكنك استخدام أحدث إصدار من حِزم تطوير البرامج (SDK) من Google GenAI للوصول إلى واجهة برمجة التطبيقات Interactions API.
- في Python، هذه هي حزمة
google-genaiمن الإصدار1.55.0فصاعدًا. - في JavaScript، هذه هي حزمة
@google/genaiمن الإصدار1.33.0والإصدارات الأحدث.
يمكنك الاطّلاع على مزيد من المعلومات حول كيفية تثبيت حِزم SDK في صفحة المكتبات.
القيود
- حالة الإصدار التجريبي: تتوفّر Interactions API في إصدار تجريبي/معاينة. قد تتغيّر الميزات والمخططات.
- MCP عن بُعد: لا يتوافق Gemini 3 مع MCP عن بُعد، ولكن ستتوفّر هذه الميزة قريبًا.
تتوافق الميزات التالية مع واجهة برمجة التطبيقات
generateContent، ولكنها غير متاحة بعد في واجهة Interactions API:
- البيانات الوصفية للفيديو: الحقل
video_metadata، ويُستخدم لضبط فواصل التقطيع ومعدّلات اللقطات المخصّصة لفهم الفيديو. - Batch API
- استدعاء الدوال تلقائيًا (Python)
- التخزين المؤقت الصريح: يُرجى العِلم أنّ التخزين المؤقت الضمني من جهة الخادم متاح في Interactions API
من خلال
previous_interaction_id.
التغييرات التي قد تؤدي إلى أعطال
تتوفّر واجهة برمجة التطبيقات Interactions API حاليًا في مرحلة تجريبية مبكرة. نعمل حاليًا على تطوير وتحسين إمكانات واجهة برمجة التطبيقات ومخططات الموارد وواجهات حزمة تطوير البرامج (SDK) استنادًا إلى الاستخدام الفعلي وملاحظات المطوّرين. نتيجةً لذلك، قد تحدث تغييرات غير متوافقة مع الإصدارات السابقة.
التغييرات الحالية التي قد تؤدي إلى عطل:
- مخطط الخطوات: تحلّ مصفوفة خطوات جديدة محلّ مصفوفة النتائج، ما يوفّر مخططًا زمنيًا منظَّمًا لكلّ دورة تفاعل.
للاطّلاع على آخر تغيير قد يؤدي إلى أعطال ومعرفة كيفية نقل البيانات، يُرجى الرجوع إلى دليل نقل البيانات المتعلقة بالتغييرات التي قد تؤدي إلى أعطال (مايو 2026).
قد تشمل التحديثات المحتملة الأخرى تغييرات في مخططات الإدخال والإخراج، وتوقيعات طرق حزمة تطوير البرامج (SDK) وبُنى العناصر، وسلوكيات ميزات معيّنة.
بالنسبة إلى أحمال العمل في مرحلة الإنتاج، عليك مواصلة استخدام واجهة برمجة التطبيقات القياسية
generateContent. ويظل هذا المسار هو المسار المقترَح لعمليات النشر الثابتة، وسنواصل تطويره وصيانته بشكل نشط.
الملاحظات
تُعدّ ملاحظاتك مهمة جدًا لتطوير Interactions API. يمكنك مشاركة أفكارك أو الإبلاغ عن أخطاء أو طلب ميزات في منتدى مطوّري الذكاء الاصطناعي من Google.
الخطوات التالية
- جرِّب دفتر ملاحظات التشغيل السريع لواجهة Interactions API.
- مزيد من المعلومات حول التفاعلات أثناء البث للتعامل مع الردود في الوقت الفعلي
- مزيد من المعلومات حول "وكيل Deep Research" في Gemini