Nov 7, 2024

שיפור עוזרים דיגיטליים מבוססי-AI לתכנות באמצעות הקשר הארוך של מודלים של Gemini

Beyang Liu

Sourcegraph

פייג' ביילי (Paige Bailey)

מהנדס חוויית מפתחים בתחום ה-AI

וישאל דהרמדיקארי (Vishal Dharmadhikari)

מהנדס פתרונות מוצר

אחד התחומים המבטיחים ביותר לשימוש בחלונות הקשר ארוכים הוא יצירה והבנה של קוד. בסיסי קוד גדולים דורשים הבנה מעמיקה של יחסי גומלין ותלות מורכבים, וזו משימה שמודלים מסורתיים של AI מתקשים בה. הגדלת כמות הקוד באמצעות חלונות הקשר גדולים מאפשרת לנו להגיע לרמת דיוק ושימושיות חדשה ביצירה ובהבנה של קוד.

שיתפנו פעולה עם Sourcegraph, היוצרים של Cody AI coding assistant שתומך במודלים של שפה גדולה כמו Gemini 1.5 Pro ו-Flash, כדי לבחון את הפוטנציאל של חלונות הקשר ארוכים בתרחישי קידוד בעולם האמיתי. ההתמקדות של Sourcegraph בשילוב של חיפוש קוד ובינה מלאכותית ביצירת קוד, וההטמעה המוצלחת של Cody בארגונים עם בסיסי קוד גדולים ומורכבים כמו Palo Alto Networks ו-Leidos, הפכו אותם לשותף האידיאלי למחקר הזה.

הגישה והתוצאות של Sourcegraph

חברת Sourcegraph השוותה בין הביצועים של Cody עם חלון הקשר של מיליון טוקנים (באמצעות Gemini 1.5 Flash של Google) לבין גרסת הייצור שלו. ההשוואה הישירה הזו אפשרה להם לבודד את היתרונות של ההקשר המורחב. הם התמקדו במתן תשובות לשאלות טכניות, משימה חשובה למפתחים שעובדים עם בסיסי קוד גדולים. הם השתמשו במערך נתונים של שאלות מאתגרות שדרשו הבנה מעמיקה של הקוד.

התוצאות היו מדהימות. שלושה מהמדדים המרכזיים של Sourcegraph – Essential Recall,‏ Essential Concision ו-Helpfulness – הראו שיפורים משמעותיים בשימוש בהקשר ארוך יותר.

זיכרון חיוני: שיעור העובדות החשובות בתשובה עלה באופן משמעותי.
תמציתיות חיונית: גם הפרופורציה של העובדות החיוניות שחולקה באורך התשובה השתפרה, מה שמצביע על תשובות תמציתיות ורלוונטיות יותר.
מועילות: ציון המועילות הכולל, שחולק באורך התשובה, עלה באופן משמעותי, מה שמצביע על חוויה ידידותית יותר למשתמש.

טקסט חלופי: תרשים עמודות שמציג שיפור באיכות בין בסיס קוד לבין Cody עם Gemini 1.5 Flash

בנוסף, השימוש במודלים עם הקשר ארוך צמצם באופן משמעותי את שיעור ההזיות הכולל (יצירת מידע שגוי שלא תואם לעובדות). שיעור ההזיות ירד מ-18.97% ל-10.48%, שיפור משמעותי בדיוק ובמהימנות.

תרשים עמודות שמציג את ההבדל בשיעור ההזיות בין בסיס הקוד לבין Cody עם Gemini 1.5 Flash

הפשרות והכיוון העתידי

למרות היתרונות המשמעותיים של הקשר ארוך, יש גם חסרונות. הזמן עד לטוקן הראשון עולה באופן לינארי עם אורך ההקשר. כדי לפתור את הבעיה הזו, Sourcegraph הטמיעה מנגנון לאחזור מראש וארכיטקטורה של מודל הקשר בשכבות לצורך שמירת מצב הביצוע של המודל במטמון. בעזרת מודלים של Gemini 1.5 Flash ו-Pro עם הקשר ארוך, הצלחנו לייעל את הזמן עד לטוקן הראשון מ-30-40 שניות לכ-5 שניות בהקשרים של 1MB – שיפור משמעותי ליצירת קוד בזמן אמת ולסיוע טכני.

השיתוף הזה ממחיש את הפוטנציאל המהפכני של מודלים עם הקשר ארוך בשיפור ההבנה של קוד ויצירת קוד. אנחנו נרגשים לשתף פעולה עם חברות כמו Sourcegraph כדי להמשיך לפתח עוד אפליקציות ופרדיגמות חדשניות עם חלונות הקשר גדולים.

כדי לקבל מידע נוסף על מתודולוגיות ההערכה המפורטות, על נקודות ההשוואה ועל הניתוח של Sourcegraph, כולל דוגמאות להמחשה, מומלץ לקרוא את פוסט הבלוג המפורט שלהם.

שיפור עוזרים דיגיטליים מבוססי-AI לתכנות באמצעות הקשר הארוך של מודלים של Gemini

הגישה והתוצאות של Sourcegraph

הפשרות והכיוון העתידי

מקרים לדוגמה שקשורים לנושא