7 تشرين الثاني (نوفمبر) 2024
تحسين أدوات الذكاء الاصطناعي المساعِدة في الترميز باستخدام السياق الطويل لنماذج Gemini
من المجالات الأكثر إثارة في تطبيق النوافذ ذات السياق الطويل هو إنشاء الرموز البرمجية وفهمها. تتطلّب قواعد البيانات الكبيرة فهمًا عميقًا للعلاقات المعقدة والتبعيات، وهو ما تواجهه نماذج الذكاء الاصطناعي التقليدية صعوبة في فهمه. من خلال توسيع مقدار الرمز باستخدام نوافذ سياق كبيرة، يمكننا تحقيق مستوى جديد من الدقة والفائدة في إنشاء الرموز وفهمها.
عقدنا شراكة مع شركة Sourcegraph، وهي الشركة التي أنشأت مساعد الترميز الذكي Cody الذي يتيح استخدام نماذج اللغة الكبيرة مثل Gemini 1.5 Pro وFlash، لاستكشاف إمكانات نوافذ السياق الطويلة في سيناريوهات الترميز في الحياة الواقعية. إنّ تركيز Sourcegraph على دمج البحث عن الرموز الذكية في إنشاء الرموز البرمجية بالذكاء الاصطناعي، ونشر Cody بنجاح في المؤسسات التي لديها قواعد رموز برمجية كبيرة ومعقدة، مثل Palo Alto Networks وLeidos، جعلت من Sourcegraph الشريك المثالي لهذا الاستكشاف.
منهج Sourcegraph والنتائج التي حقّقها
قارنت شركة Sourcegraph أداء Cody مع 1 مليون رمز مميّز يستند إلى السياق (باستخدام Gemini 1.5 Flash من Google) مقارنةً بإصداره العلني. وقد سمحت لهم هذه المقارنة المباشرة بتحديد مزايا السياق الموسّع. وركّز الفريق على الإجابة عن الأسئلة الفنية، وهي مهمة حاسمة للمطوّرين الذين يعملون مع قواعد بيانات كبيرة. وقد استخدمت مجموعة بيانات من الأسئلة الصعبة التي تتطلّب فهمًا عميقًا للرمز.
كانت النتائج مذهلة. أظهرت ثلاثة من مقاييس الأداء الرئيسية في Sourcegraph، وهي "الاستدعاء الأساسي" و"الملخّص الأساسي" و"المساعدة"، تحسينات كبيرة عند استخدام السياق الأطول.
تذكُّر المعلومات الأساسية: زادت نسبة الحقائق المهمة في الردّ بشكل كبير.
الإيجاز الأساسي: تحسّنت أيضًا نسبة الحقائق الأساسية التي تم تسويتها حسب طول الردّ، ما يشير إلى تقديم إجابات أكثر إيجازًا وصلةً بالموضوع.
مدى المساعدة: زادت بشكل كبير نتيجة مدى المساعدة الإجمالية، التي تم تسويتها حسب طول الردّ، ما يشير إلى تجربة أكثر ملاءمةً للمستخدم.
بالإضافة إلى ذلك، أدى استخدام نماذج السياق الطويل إلى خفض معدّل الأوهام بشكل كبير (أي إنشاء معلومات غير صحيحة من الناحية الواقعية). انخفض معدّل الهلوسة من% 18.97 إلى %10.48، ما يشكّل تحسّنًا كبيرًا في الدقة والموثوقية.
المفاضلات والاتجاه المستقبلي
على الرغم من أنّ فوائد السياق الطويل كبيرة، إلا أنّ هناك بعض السلبيات. يزداد الوقت المستغرَق للوصول إلى الرمز المميّز الأول بشكل خطي مع طول السياق. للحدّ من هذه المشكلة، نفّذ فريق Sourcegraph آلية للتحميل المُسبَق وبنية نموذج سياق مُتعدّد الطبقات لتخزين حالة تنفيذ النموذج في ذاكرة التخزين المؤقت. باستخدام نماذج Gemini 1.5 Flash وPro ذات السياق الطويل، تم تحسين الوقت المستغرَق لعرض الرمز المميّز الأول من 30 إلى 40 ثانية إلى 5 ثوانٍ تقريبًا للسياقات التي تبلغ 1 ميغابايت، ما يشكّل تحسُّنًا كبيرًا في إنشاء الرموز البرمجية والمساعدة الفنية في الوقت الفعلي.
يوضّح هذا التعاون الإمكانات التحويلية للنماذج المستندة إلى السياق الطويل في إحداث ثورة في فهم الرموز البرمجية وإنشائها. يسرّنا التعاون مع شركات مثل Sourcegraph لمواصلة توفير المزيد من التطبيقات والنماذج المبتكرة باستخدام نوافذ سياق كبيرة.
للاطّلاع على مزيد من التفاصيل حول منهجيات التقييم والمقاييس والتحليل التفصيلية في Sourcegraph، بما في ذلك الأمثلة التوضيحية، يمكنك الاطّلاع على مشاركة المدوّنة التفصيلية.