توسّع الأدوات إمكانات نماذج Gemini، ما يتيح لها اتّخاذ إجراءات في العالم الحقيقي والوصول إلى المعلومات في الوقت الفعلي وتنفيذ مهام حسابية معقّدة. يمكن للنماذج استخدام الأدوات في كلٍّ من التفاعلات العادية لطلب البيانات والاستجابة لها و جلسات البث في الوقت الفعلي باستخدام Live API.
الأدوات هي إمكانات محدّدة (مثل "بحث Google" أو "تنفيذ الرموز البرمجية") يمكن للنموذج استخدامها للإجابة عن الطلبات. توفر Gemini API مجموعة من الأدوات المُدارة بالكامل والمضمّنة، أو يمكنك تحديد أدوات مخصّصة باستخدام ميزة "استدعاء الدوال".
لإنشاء أنظمة متعدّدة الخطوات وموجّهة نحو تحقيق هدف، يُرجى الاطّلاع على نظرة عامة على الوكلاء.
الأدوات المضمّنة المتاحة
| الأداة | الوصف | حالات الاستخدام |
|---|---|---|
| بحث Google | تحديد مصادر الردود استنادًا إلى الأحداث والحقائق الحالية من الويب للحدّ من الهلوسة | \- الإجابة عن أسئلة حول الأحداث الأخيرة \- التأكّد من الحقائق باستخدام مصادر متنوّعة |
| خرائط Google | إنشاء مساعدين يمكنهم التعرّف على الموقع الجغرافي والعثور على الأماكن والحصول على الاتجاهات وتقديم سياق محلي غني | \- تخطيط برامج السفر التي تتضمّن محطات توقف متعدّدة \- العثور على المؤسسات المحلية استنادًا إلى معايير المستخدم |
| تنفيذ الرموز البرمجية | السماح للنموذج بكتابة رموز Python البرمجية وتشغيلها لحلّ المسائل الرياضية أو معالجة البيانات بدقة | \- حلّ المعادلات الرياضية المعقّدة \- معالجة بيانات النصوص وتحليلها بدقة |
| سياق عنوان URL | توجيه النموذج لقراءة المحتوى وتحليله من صفحات ويب أو مستندات معيّنة | \- الإجابة عن الأسئلة استنادًا إلى عناوين URL أو مستندات معيّنة \- استرداد المعلومات من صفحات ويب مختلفة |
| استخدام الكمبيوتر (إصدار تجريبي) | السماح لـ Gemini بعرض شاشة وإنشاء إجراءات للتفاعل مع واجهات مستخدم متصفّح الويب (التنفيذ من جهة العميل) | \- أتمتة مهام سير العمل المتكرّرة المستندة إلى الويب \- اختبار واجهات مستخدم تطبيقات الويب |
| البحث عن الملفات | فهرسة مستنداتك والبحث فيها لتفعيل ميزة "التوليد المعزّز بالاسترجاع" (RAG) | - البحث في الأدلة الفنية - الإجابة عن الأسئلة حول البيانات الخاصة |
يمكنك الاطّلاع على صفحة الأسعار لمعرفة تفاصيل التكاليف المرتبطة بأدوات معيّنة.
طريقة تنفيذ الأدوات
تسمح الأدوات للنموذج بطلب إجراءات أثناء المحادثة. يختلف سير العمل استنادًا إلى ما إذا كانت الأداة مضمّنة (تُديرها Google) أو مخصّصة (تُديرها أنت).
سير عمل الأدوات المضمّنة
بالنسبة إلى الأدوات المضمّنة (مثل "بحث Google" و"خرائط Google" و"سياق عنوان URL" و"البحث عن الملفات" و"تنفيذ الرموز البرمجية")، تتم العملية بالكامل في طلب بيانات من واجهة برمجة التطبيقات واحد:
- أنت تُرسِل طلبًا: "ما هو الجذر التربيعي لأحدث سعر لسهم GOOG؟"
- يقرّر Gemini أنّه بحاجة إلى أدوات وينفّذها على خوادم Google (على سبيل المثال، يبحث عن سعر السهم، ثم يشغّل رمز Python البرمجي لحساب الجذر التربيعي).
- يُرسِل Gemini الردّ النهائي استنادًا إلى نتائج الأداة.
سير عمل الأدوات المخصّصة (استدعاء الدوال)
بالنسبة إلى الأدوات المخصّصة وميزة "استخدام الكمبيوتر"، يتولّى تطبيقك تنفيذها:
- أنت تُرسِل طلبًا مع إعلانات الدوال (الأدوات).
- قد يُرسِل Gemini استجابة JSON منظَّمة لاستدعاء دالة معيّنة
(على سبيل المثال،
{"name": "get_order_status", "args": {"order_id": "123"}})، مع تضمينidفريد دائمًا. - أنت تنفّذ الدالة في تطبيقك أو بيئتك.
- أنت تُرسِل نتائج الدالة إلى Gemini، مع تضمين
idنفسه الذي تم استخدامه في استدعاء الدالة، - يستخدم Gemini النتائج لإنشاء ردّ نهائي أو استدعاء أداة أخرى.
مزيد من المعلومات في دليل استدعاء الدوال.
سير عمل الجمع بين الأدوات المضمّنة والمخصّصة
- أنت تُرسِل طلبًا وتُعلن عن الأدوات المضمّنة والدوال المخصّصة التي تريد تفعيلها، مع ضبط علامة لتفعيل ميزة الجمع بين الأدوات.
- ينفّذ Gemini الأدوات المضمّنة ويُرجع النتيجة إلى المستخدم إذا تم إنشاء أي استدعاءات للدوال من جهة العميل (يعتمد ترتيب التنفيذ على الطلب وما يقرّره النموذج). ويُرسِل ردًا يتضمّن ما يلي:
- تأكيد استدعاء الأداة
- نتائج استجابة الأداة (قد تظهر بعد استجابة JSON إذا أنشأ النموذج استدعاءَين متوازيين للدوال)
- استجابة JSON منظَّمة لاستدعاء الدالة
- توقيعات الأفكار المشفّرة للحفاظ على السياق
- أنت تنفّذ الدالة في تطبيقك أو بيئتك.
- أنت تُرسِل جميع أجزاء ردّ Gemini، بالإضافة إلى نتائج استدعاء الدالة.
- ينشئ Gemini الردّ النهائي باستخدام جميع السياقات المجمّعة.
يُرجى قراءة دليل الجمع بين الأدوات للتعرّف على كيفية تفعيل ميزة الجمع بين الأدوات المضمّنة والمخصّصة، والاطّلاع على أمثلة عن تداول السياق.
المُخرجات المنظَّمة مقابل استدعاء الدوال
يوفّر Gemini طريقتَين لإنشاء مُخرجات منظَّمة. استخدِم ميزة "استدعاء الدوال" عندما يحتاج النموذج إلى تنفيذ خطوة وسيطة من خلال الاتصال بأدواتك أو أنظمة البيانات الخاصة بك. استخدِم ميزة "المُخرجات المنظَّمة" عندما تحتاج بدقة إلى أن يلتزم الردّ النهائي للنموذج بمخطط معيّن، مثل عرض واجهة مستخدم مخصّصة.
المُخرجات المنظَّمة مع الأدوات
يمكنك الجمع بين ميزة "المُخرجات المنظَّمة" والأدوات المضمّنة لضمان أن تلتزم ردود النموذج المستندة إلى البيانات أو العمليات الحسابية الخارجية بمخطط صارم.
يمكنك الاطّلاع على المُخرجات المنظَّمة مع الأدوات للحصول على أمثلة عن الرموز البرمجية.