‫7 نوفمبر 2024

تحسين أداء مساعدي الترميز المستندين إلى الذكاء الاصطناعي باستخدام السياق الطويل لنماذج Gemini

بيانغ ليو

Sourcegraph

"بايج بيلي"

مهندس تجربة المطوّرين في مجال الذكاء الاصطناعي

فيشال دارماديكاري

مهندس حلول المنتجات

من أبرز مجالات تطبيق نوافذ السياق الطويل هي إنشاء الرموز البرمجية وفهمها. تتطلّب قواعد الرموز البرمجية الكبيرة فهمًا عميقًا للعلاقات والتبعيات المعقّدة، وهو أمر يصعب على نماذج الذكاء الاصطناعي التقليدية استيعابه. من خلال توسيع حجم الرمز البرمجي باستخدام نوافذ سياق كبيرة، يمكننا تحقيق مستوى جديد من الدقة والفائدة في إنشاء الرموز البرمجية وفهمها.

تعاونّا مع Sourcegraph، مبتكرَي المساعد البرمجي Cody AI الذي يتوافق مع نماذج اللغات الكبيرة، مثل Gemini 1.5 Pro وFlash، لاستكشاف إمكانات نوافذ السياق الموسّع في سيناريوهات الترميز الواقعية. إنّ تركيز Sourcegraph على دمج البحث عن الرموز البرمجية والذكاء في إنشاء الرموز البرمجية المستند إلى الذكاء الاصطناعي، وعمليات نشر Cody الناجحة في المؤسسات التي لديها قواعد رموز برمجية كبيرة ومعقّدة، مثل Palo Alto Networks وLeidos، جعلها الشريك المثالي لهذه الاستكشافات.

منهجية Sourcegraph ونتائجها

قارنت شركة Sourcegraph أداء Cody مع مليون رمز مميّز يستند إلى السياق (باستخدام Gemini 1.5 Flash من Google) بالإصدار المتاح للجميع. وقد سمحت لهم هذه المقارنة المباشرة بتحديد مزايا السياق الموسّع. ركّزت هذه النماذج على الإجابة عن الأسئلة الفنية، وهي مهمة أساسية للمطوّرين الذين يعملون على قواعد بيانات كبيرة. وقد استخدموا مجموعة بيانات تتضمّن أسئلة صعبة تتطلّب فهمًا عميقًا للرموز البرمجية.

كانت النتائج مذهلة. حقّقت ثلاثة من مؤشرات الأداء الرئيسية في Sourcegraph، وهي "الاسترجاع الأساسي" و"الإيجاز الأساسي" و"الفائدة"، تحسينات كبيرة عند استخدام السياق الأطول.

تذكُّر المعلومات الأساسية: زادت نسبة الحقائق المهمة في الردّ بشكل كبير.
الإيجاز الأساسي: تحسّنت أيضًا نسبة الحقائق الأساسية التي تمّت تسويتها حسب طول الردّ، ما يشير إلى تقديم إجابات أكثر إيجازًا وملاءمةً.
المساعدة: زادت درجة المساعدة الإجمالية، التي تمّت تسويتها حسب طول الردّ، بشكلٍ كبير، ما يشير إلى تجربة أكثر ملاءمة للمستخدمين.

نص بديل لهذا الرسم البياني: رسم بياني شريطي يعرض التحسّن في الجودة بين قاعدة الرموز البرمجية وCody باستخدام Gemini 1.5 Flash

بالإضافة إلى ذلك، أدّى استخدام نماذج ذات سياق طويل إلى خفض معدّل الهلوسة الإجمالي (إنشاء معلومات غير صحيحة واقعيًا) بشكل كبير. انخفضت نسبة الهلوسة من ‎18.97% إلى ‎10.48%، ما يشير إلى تحسّن كبير في الدقة والموثوقية.

رسم بياني شريطي يعرض الفرق في معدّل الهلوسة بين قاعدة Code وCody مع Gemini 1.5 Flash

المفاضلة والاتجاه المستقبلي

على الرغم من المزايا الكبيرة التي يقدّمها السياق الطويل، هناك بعض العيوب. يزداد الوقت اللازم لإنشاء الرمز المميز الأول بشكل خطي مع طول السياق. للتخفيف من هذه المشكلة، نفّذت Sourcegraph آلية جلب مسبق وبنية نموذج سياق متعدد الطبقات لتخزين بيانات حالة تنفيذ النموذج مؤقتًا. باستخدام نماذج Gemini 1.5 Flash وPro التي تستند إلى السياق الطويل، تم تحسين الوقت اللازم لإنشاء الرمز المميز الأول من 30 إلى 40 ثانية إلى حوالي 5 ثوانٍ للسياقات التي تبلغ سعتها 1 ميغابايت، ما يمثّل تحسّنًا كبيرًا في إنشاء الرموز البرمجية في الوقت الفعلي وتقديم المساعدة الفنية.

يُبرز هذا التعاون الإمكانات التحويلية لنماذج السياق الطويل في إحداث ثورة في فهم الرموز البرمجية وإنشائها. يسرّنا التعاون مع شركات مثل Sourcegraph لمواصلة توفير المزيد من التطبيقات والنماذج المبتكرة التي تتضمّن نوافذ سياق كبيرة.

للتعمّق أكثر في منهجيات التقييم التفصيلية والمقاييس والمعايير والتحليلات التي تستخدمها Sourcegraph، بما في ذلك الأمثلة التوضيحية، لا تفوّت منشور المدونة المفصّل.

تحسين أداء مساعدي الترميز المستندين إلى الذكاء الاصطناعي باستخدام السياق الطويل لنماذج Gemini

منهجية Sourcegraph ونتائجها

المفاضلة والاتجاه المستقبلي

دراسات الحالة ذات الصلة