مشاركة

‫7 نوفمبر 2024

تحسين أداء مساعدي الترميز المستندين إلى الذكاء الاصطناعي باستخدام ميزة "السياق الطويل" في نماذج Gemini

بيانغ ليو

Sourcegraph

Paige Bailey

مهندس تجربة المطوّرين في مجال الذكاء الاصطناعي

فيشال دارماديكاري

مهندس حلول المنتجات

Sourcegraph showcase hero

من أبرز مجالات تطبيق نوافذ السياق الطويل هي إنشاء الرموز البرمجية وفهمها. تتطلّب قواعد الرموز البرمجية الكبيرة فهمًا عميقًا للعلاقات والتبعيات المعقّدة، وهو أمر يصعب على نماذج الذكاء الاصطناعي التقليدية استيعابه. من خلال توسيع حجم الرمز باستخدام نوافذ سياق كبيرة، يمكننا تحقيق مستوى جديد من الدقة والفائدة في إنشاء الرموز البرمجية وفهمها.

تعاونّا مع Sourcegraph، الشركة المطوّرة لمساعد البرمجة Cody المستند إلى الذكاء الاصطناعي والمتوافق مع نماذج اللغات الكبيرة مثل Gemini 1.5 Pro وFlash، وذلك لاستكشاف إمكانات نوافذ السياق الموسّع في سيناريوهات البرمجة الواقعية. إنّ تركيز Sourcegraph على دمج البحث عن الرموز البرمجية والذكاء في إنشاء الرموز البرمجية المستندة إلى الذكاء الاصطناعي، بالإضافة إلى نشر Cody بنجاح في المؤسسات التي لديها قواعد رموز برمجية كبيرة ومعقّدة، مثل Palo Alto Networks وLeidos، جعلها الشريك المثالي لهذه الاستكشاف.

منهجية Sourcegraph ونتائجها

قارنت شركة Sourcegraph أداء Cody مع مليون رمز مميّز يستند إلى السياق (باستخدام Gemini 1.5 Flash من Google) بالإصدار المتاح للجميع. وقد سمحت لهم هذه المقارنة المباشرة بتحديد مزايا السياق الموسّع. ركّزت هذه النماذج على الإجابة عن الأسئلة الفنية، وهي مهمة أساسية للمطوّرين الذين يعملون على قواعد بيانات كبيرة. وقد استخدموا مجموعة بيانات تتضمّن أسئلة صعبة تتطلّب فهمًا عميقًا للرموز البرمجية.

كانت النتائج مذهلة. حقّقت ثلاثة من مؤشرات الأداء الرئيسية في Sourcegraph، وهي "الاسترجاع الأساسي" و"الإيجاز الأساسي" و"الفائدة"، تحسينات كبيرة عند استخدام السياق الأطول.



  • تذكُّر المعلومات الأساسية: زادت نسبة الحقائق المهمة في الردّ بشكل كبير.

  • الحدّ الأدنى من الإيجاز: تحسّنت أيضًا نسبة الحقائق الأساسية التي تمّت تسويتها حسب طول الردّ، ما يشير إلى تقديم إجابات أكثر إيجازًا وملاءمةً.

  • المساعدة: زادت درجة المساعدة الإجمالية بشكل كبير، وتمت تسويتها حسب طول الرد، ما يشير إلى تجربة أكثر ملاءمة للمستخدمين.

نص بديل لهذا الرسم البياني: رسم بياني شريطي يعرض تحسّن الجودة بين قاعدة الرموز البرمجية وCody باستخدام Gemini 1.5 Flash

بالإضافة إلى ذلك، أدّى استخدام نماذج السياق الطويل إلى خفض معدّل الهلوسة الإجمالي (أي إنشاء معلومات غير صحيحة من الناحية الواقعية) بشكل كبير. انخفضت نسبة الهلوسة من ‎18.97% إلى ‎10.48%، ما يشير إلى تحسّن كبير في الدقة والموثوقية.

رسم بياني شريطي يعرض الفرق في معدّل الهلوسة بين قاعدة Code وCody باستخدام Gemini 1.5 Flash

المفاضلات والاتجاه المستقبلي

على الرغم من المزايا الكبيرة التي يقدّمها السياق الطويل، هناك بعض العيوب. يزداد الوقت اللازم لإنشاء الرمز المميز الأول بشكل خطي مع طول السياق. للتخفيف من هذه المشكلة، نفّذت Sourcegraph آلية جلب مسبق وبنية نموذج سياق متعدد الطبقات لتخزين بيانات حالة تنفيذ النموذج مؤقتًا. باستخدام نماذج السياق الطويل في Gemini 1.5 Flash وPro، تم تحسين الوقت اللازم لإنشاء الرمز المميز الأول من 30 إلى 40 ثانية إلى حوالي 5 ثوانٍ لسياقات بحجم 1 ميغابايت، ما يمثّل تحسّنًا كبيرًا في إنشاء الرموز البرمجية في الوقت الفعلي وتقديم المساعدة الفنية.

يُبرز هذا التعاون الإمكانات التحويلية لنماذج السياق الطويل في إحداث ثورة في فهم الرموز البرمجية وإنشائها. يسرّنا التعاون مع شركات مثل Sourcegraph لمواصلة توفير المزيد من التطبيقات والنماذج المبتكرة التي تتضمّن قدرة استيعاب كبيرة.

للتعمّق أكثر في منهجيات التقييم التفصيلية والمقاييس والمعايير والتحليلات التي أجرتها Sourcegraph، بما في ذلك الأمثلة التوضيحية، لا تفوّت منشور المدوّنة المفصّل.