27 أكتوبر 2025
تتتبّع Raindrop أداء وكيل الذكاء الاصطناعي على نطاق واسع باستخدام Gemini 2.5 Flash
تفرض وكلاء الذكاء الاصطناعي تحديات فريدة في ما يتعلق بالمراقبة مقارنةً بالبرامج التقليدية. غالبًا ما تكون الأعطال في أنظمة الذكاء الاصطناعي "صامتة"، ما يعني أنّها قد لا تؤدي إلى ظهور استثناءات أو أخطاء عادية، ما يصعّب على فِرق الهندسة رصد المشاكل. قد لا تنجح طرق تصحيح الأخطاء التقليدية، مثل البحث في السجلات أو الاعتماد على التقييمات قبل الإنتاج، في رصد مشاكل الأداء في العالم الواقعي.
توفّر منصة Raindrop مراقبة مصمّمة خصيصًا لوكلاء الذكاء الاصطناعي في مرحلة الإنتاج. يساعد هذا المقياس فِرق الهندسة في تحديد المشاكل المعقّدة، مثل حالات تعذّر استدعاء الأدوات وإحباط المستخدمين، من خلال معالجة كميات كبيرة من تفاعلات المستخدمين. لتعزيز فعالية مسار المراقبة، تستخدم Raindrop نموذج Gemini 2.5 Flash في التصنيف والتلخيص وإعادة ترتيب نتائج البحث.
تفعيل المراقبة في الوقت الفعلي على نطاق واسع
تعالج منصة Raindrop عشرات الملايين من الأحداث يوميًا. أحد التحديات الرئيسية التي تواجه Raindrop هو تمكين فِرق الهندسة من الاستعلام عن المشاكل وتصنيفها في مجموعات البيانات الهائلة هذه في الوقت الفعلي تقريبًا. عندما يحدّد المستخدم مشكلة جديدة لتتبُّعها، يجب أن يفسّر نظام Raindrop هدف المستخدم بسرعة ويحلّل تدفّقات الأحداث للعثور على تطابقات.
تتطلّب هذه المعالجة العالية الإنتاجية نماذج توفّر وقت استجابة منخفضًا للغاية وفعالية عالية من حيث التكلفة. كانت Raindrop بحاجة إلى حلّ لتشغيل مسار "المراقبة الدلالية" الأساسي والميزات الجديدة، مثل Deep Search، وهي أداة للبحث في بيانات الذكاء الاصطناعي الخاصة بالإنتاج، بدون تكبّد تكاليف باهظة أو بطء في أوقات الاستجابة يؤدي إلى تقليل تجربة المستخدم.
يقول بن هيلاك، المؤسس المشارك والمدير التنفيذي للتكنولوجيا في Raindrop: "كنّا بحاجة إلى نموذج يمكنه معالجة هذه الأحداث الأولية بسرعة وبتكلفة معقولة". "تتيح سرعة الاستجابة المنخفضة والذكاء الذي يتمتّع به نموذج Gemini 2.5 Flash إمكانية استخدام منتج Deep Search الذي كان سيتعذّر استخدامه لولا ذلك، إذ كان سيكون بطيئًا ومكلفًا جدًا مع النماذج الأخرى".
تطبيق Gemini 2.5 Flash لتحقيق السرعة والحصول على نتائج منظَّمة
دمجت Raindrop Gemini 2.5 Flash لإدارة التصنيف وإعادة كتابة طلبات البحث. تم تبسيط عملية التنفيذ باستخدام Vercel AI SDK، ما أتاح لـ Raindrop دمج النماذج بسرعة.
تستفيد Raindrop من نموذج Gemini 2.5 Flash في العديد من الوظائف الرئيسية، مثل:
- توسيع نطاق طلب البحث وإعادة كتابته: في مسار Deep Search، يتم الاستفادة من Gemini 2.5 Flash لإعادة كتابة طلبات البحث التي يقدّمها المستخدمون بهدف تحسين النتائج، ما يؤدي إلى تحسين مدى صلة البحث بملايين الأحداث.
- النتائج المنظَّمة: تستخدم Raindrop ميزة "استدعاء الأدوات" والنتائج المنظَّمة لضمان الحصول على نتائج أكثر دقة من تفاعلات النموذج. وتُعدّ هذه الموثوقية ضرورية لتصحيح الأخطاء وتقديم آثار استدلال دقيقة للمستخدمين.
قبل استخدام Gemini 2.5 Flash، قيّمت شركة Raindrop نماذج صغيرة أخرى، لكنّها وجدت أنّ نسبة التكلفة إلى الأداء غير مناسبة. "كانت النماذج الأخرى إما باهظة التكلفة أو بطيئة جدًا أو غير ذكية بما يكفي أو لا تنتج نتائج منظَّمة موثوقة". أشار "هيلاك" إلى ما يلي: "لم يكن معدّل الذكاء إلى التكلفة منطقيًا إلا مع Gemini 2.5 Flash".
تقليل أوقات البحث وخفض التكاليف بنسبة %90
من خلال التبديل إلى نموذج Gemini 2.5 Flash، حقّقت Raindrop تحسينات كبيرة في الأداء والكفاءة.
تشمل النتائج الرئيسية ما يلي:
- تقليل أوقات البحث من ساعات إلى أقل من دقيقة في كثير من الأحيان
- خفض التكاليف بأكثر من %90
- زيادة الموثوقية في كل من التقييمات ومراقبة الإنتاج
تستفيد Raindrop من إمكانية Gemini API في توفير مخرجات منظَّمة واستخدام الأدوات ضمن مسار البحث العميق. ويتيح ذلك للمطوّرين الحصول على نتائج دقيقة وعرض عمليات التتبُّع الخاصة بتحديد المشاكل من أجل تصحيح الأخطاء، وهو أمر بالغ الأهمية للحفاظ على نظام موثوق. تم إكمال عملية الدمج الأولية في غضون دقائق باستخدام حزمة تطوير البرامج (SDK) المستندة إلى الذكاء الاصطناعي من Vercel.
بناء مستقبل مراقبة الوكلاء
تواصل Raindrop تطوير منصة المراقبة الأصلية للوكلاء من خلال ميزات مثل التتبُّع الكامل والرصد التلقائي لمشاكل استدعاء الأدوات. ويرون أنّه مع ازدياد سرعة نماذج الذكاء الاصطناعي وموثوقيتها، ستتمكّن النماذج الوكيلة من التعامل مع مهام أكثر تعقيدًا.
"على المطوّرين الاستفادة من مخرجات Gemini 2.5 Flash المنظَّمة والموثوقة ونموذج التسعير الخاص به لتفعيل حالات استخدام كانوا يعتقدون سابقًا أنّها باهظة التكلفة"، هذا ما نصح به "هيلاك". "من المرجّح أن يغيّر Gemini 2.5 Flash مسار تطوير منتجك من خلال السماح لك بتقديم تجارب ذكية للمستخدمين تتوافق مع نموذج التسعير الخاص بك".
لبدء إنشاء تطبيقاتك الخاصة، يمكنك استكشاف إمكانات نماذج Gemini في مستندات واجهة برمجة التطبيقات.