مشاركة

7 تشرين الثاني (نوفمبر) 2024

تحسين أدوات الذكاء الاصطناعي المساعِدة في الترميز باستخدام السياق الطويل لنماذج Gemini

بييانغ ليو

Sourcegraph

بايج بيلي

مهندس تجربة المطوّرين في الذكاء الاصطناعي

فيشال دارماديكاري

مهندس حلول المنتجات

الصورة الرئيسية لعرض Sourcegraph

من المجالات الأكثر إثارة في تطبيق النوافذ ذات السياق الطويل هو إنشاء الرموز البرمجية وفهمها. تتطلّب قواعد البيانات الكبيرة فهمًا عميقًا للعلاقات والموارد المعقدة، وهو ما تواجهه نماذج الذكاء الاصطناعي التقليدية صعوبة في فهمه. من خلال توسيع مقدار الرمز البرمجي باستخدام نوافذ سياق كبيرة، يمكننا تحقيق مستوى جديد من الدقة والفائدة في إنشاء الرموز البرمجية وفهمها.

عقدنا شراكة مع شركة Sourcegraph، وهي الشركة التي أنشأت مساعد الترميز الذكي Cody الذي يتيح استخدام نماذج اللغة الكبيرة مثل Gemini 1.5 Pro وFlash، لاستكشاف إمكانات نوافذ السياق الطويلة في سيناريوهات الترميز في الحياة الواقعية. إنّ تركيز Sourcegraph على دمج البحث عن الرموز الذكية في إنشاء الرموز البرمجية بالذكاء الاصطناعي، ونشر Cody بنجاح في المؤسسات التي لديها قواعد رموز برمجية كبيرة ومعقدة، مثل Palo Alto Networks وLeidos، جعلت من Sourcegraph الشريك المثالي لهذا الاستكشاف.

منهج Sourcegraph والنتائج التي حقّقها

قارنت شركة Sourcegraph أداء Cody مع 1 مليون رمز مميّز يستند إلى السياق (باستخدام Gemini 1.5 Flash من Google) مقارنةً بإصداره العلني. وقد سمحت لهم هذه المقارنة المباشرة بتحديد مزايا السياق الموسّع. وركّز الفريق على الإجابة عن الأسئلة الفنية، وهي مهمة حاسمة للمطوّرين الذين يعملون مع قواعد بيانات كبيرة. وقد استخدمت مجموعة بيانات من الأسئلة الصعبة التي تتطلّب فهمًا عميقًا للرمز.

كانت النتائج مذهلة. أظهرت ثلاثة من مقاييس الأداء الرئيسية في Sourcegraph، وهي "الاستدعاء الأساسي" و"الملخّص الأساسي" و"المساعدة"، تحسينات كبيرة عند استخدام السياق الأطول.



  • تذكُّر المعلومات الأساسية: زادت نسبة الحقائق المهمة في الردّ بشكل كبير.

  • الإيجاز الأساسي: تحسّنت أيضًا نسبة الحقائق الأساسية التي تمّ تسويتها حسب طول الردّ، ما يشير إلى تقديم إجابات أكثر إيجازًا وصلةً.

  • مدى المساعدة: زادت بشكل كبير نتيجة مدى المساعدة الإجمالية، التي تم تسويتها حسب طول الردّ، ما يشير إلى تجربة أكثر ملاءمةً للمستخدم.

النص البديل لهذا: رسم بياني شريطي يعرض تحسين الجودة بين قاعدة Code وCody باستخدام Gemini 1.5 Flash

بالإضافة إلى ذلك، أدى استخدام نماذج السياق الطويل إلى خفض معدّل الأوهام بشكل كبير (أي إنشاء معلومات غير صحيحة من الناحية الواقعية). انخفض معدّل الهلوسة من% 18.97 إلى %10.48، ما يشكّل تحسّنًا كبيرًا في الدقة والموثوقية.

رسم بياني شريطي يعرض الفرق في معدّل الأوهام بين قاعدة Code base وCody مع Gemini 1.5 Flash

المفاضلات والاتجاه المستقبلي

على الرغم من أنّ فوائد السياق الطويل كبيرة، إلا أنّ هناك بعض السلبيات. يزداد الوقت المستغرَق للوصول إلى الرمز المميّز الأول بشكل خطي مع طول السياق. للحدّ من هذه المشكلة، نفّذ فريق Sourcegraph آلية للتحميل المُسبَق وبنية نموذج سياق مُتعدّد الطبقات لتخزين حالة تنفيذ النموذج في ذاكرة التخزين المؤقت. باستخدام نماذج Gemini 1.5 Flash وPro ذات السياق الطويل، تم تحسين الوقت المستغرَق لعرض الرمز المميّز الأول من 30 إلى 40 ثانية إلى 5 ثوانٍ تقريبًا للسياقات التي تبلغ 1 ميغابايت، ما يشكّل تحسُّنًا كبيرًا في إنشاء الرموز البرمجية والمساعدة الفنية في الوقت الفعلي.

يوضّح هذا التعاون الإمكانات التحويلية للنماذج المستندة إلى السياق الطويل في إحداث ثورة في فهم الرموز البرمجية وإنشائها. يسرّنا التعاون مع شركات مثل Sourcegraph لمواصلة توفير المزيد من التطبيقات والنماذج المبتكرة باستخدام نوافذ سياق كبيرة.

للاطّلاع على مزيد من المعلومات التفصيلية عن منهجيات التقييم والمقاييس والتحليل في Sourcegraph، بما في ذلك الأمثلة التوضيحية، يمكنك الاطّلاع على مشاركة المدوّنة التفصيلية.