16 במאי 2025
Harvey: אימות של חשיבה משפטית מתקדמת בגרסת טרום-השקה של Gemini 2.5 Pro באמצעות BigLaw Bench
Harvey: אימות של חשיבה משפטית מתקדמת בגרסת טרום-השקה של Gemini 2.5 Pro באמצעות BigLaw Bench
בתחום המשפטי יש דרישה לפתרונות AI שיכולים להתמודד עם נפח עצום של מידע מורכב בדיוק ובניואנסים. בדרך כלל, מדדים מסורתיים של AI לא מצליחים לשקף את הדרישות של עבודה משפטית בעולם האמיתי, ולכן קשה לזהות מודלים שיכולים לבצע עבודה משפטית בעלת ערך גבוה. חברת הסטארט-אפ הדינמית Harvey, שמתמחה בשינוי תהליכי עבודה משפטיים באמצעות AI, התמודדה עם האתגר הזה באמצעות פיתוח BigLaw Bench, מסגרת מקיפה להערכת הביצועים של מודלים גדולים של שפה (LLM) במשימות שמשקפות עבודה משפטית בפועל. בבדיקות המקיפות שנערכו לאחרונה, גרסת טרום-ההשקה של Gemini 2.5 Pro בלטה בביצועים שלה והוכיחה פוטנציאל יוצא דופן לשיפור היעילות בתחומים משפטיים מרכזיים.
Gemini 2.5 Pro Preview מוביל ב-BigLaw Bench
ההערכות האחרונות של הארווי, שמתבססות על מסגרת BigLaw Bench, מצביעות בבירור על כך שגרסת טרום ההשקה של Gemini 2.5 Pro מפגינה רמה גבוהה במיוחד של מיומנות במשימות ליבה של הסקת מסקנות משפטיות, ובמיוחד במשימות שדורשות הסקת מסקנות על סמך קלט או פלט משפטיים ארוכים. כפי שניתן לראות בתוצאות ששותפו באופן ציבורי על ידי הארווי, שהתקבלו מבדיקת מודלים כולל גרסת טרום-ההשקה של Gemini 2.5 Pro דרך ממשקי ה-API שלהם, גרסת טרום-ההשקה של Gemini 2.5 Pro השיגה את הציון המוביל של 85.02% ב-BigLaw Bench, והייתה טובה יותר ממודלים אחרים שהוערכו בבדיקה המקיפה הזו.
היכולת המתקדמת הזו חיונית למגוון רחב של פעילויות משפטיות בעלות ערך גבוה. משימות מרכזיות להערכה ב-BigLaw Bench הציגו את היתרונות של גרסת טרום ההשקה של Gemini 2.5 Pro:
- בדיקת נאותות של עסקאות: גרסת טרום-השקה של Gemini 2.5 Pro הראתה יכולת גבוהה לחילוץ ולסיכום של סעיפים חשובים (למשל, סעיפים בנושא העברה, שיפוי וסיום) מכמה הסכמי שירות ארוכים. המשמעות היא שיש פוטנציאל משמעותי לייעל את התהליך הממושך של בדיקת מסמכים ידנית.
- תכנון עסקאות: המודל יצר ניתוחים השוואתיים מקיפים ומובנים היטב של אפשרויות פיננסיות מורכבות (למשל, PIPE, הנפקות מניות בערבות, הנפקות אג"ח). המודל הראה פוטנציאל בהצגת המידע הזה בצורה ברורה ונגישה, גם למי שאין לו מומחיות פיננסית עמוקה, ובהצעת פעולות מיידיות אפשריות.
- ניסוח מסמכים משפטיים: כשנבדק בביצוע משימות שקשורות להתדיינות משפטית, Gemini 2.5 Pro Preview הראה יכולת מרשימה ליצור מתארים מפורטים של טיעונים משפטיים על סמך כמויות גדולות של מסמכי תדרוך. היכולת הזו מצביעה על עתיד שבו AI יוכל לעזור באופן משמעותי בשלבים הראשוניים של פיתוח טיעונים משפטיים וארגון שלהם.
- בדיקה וניתוח של מסמכים: הערכות שכללו בדיקה של מסמכים שונים מניסויים (יומני שיחות, אימיילים, תזכירים) הראו את היכולת של גרסת טרום-השקה של Gemini 2.5 Pro ליצור סיכומים כרונולוגיים עקביים של אירועים. בנוסף, המודל הראה פוטנציאל בזיהוי חוסר עקביות ואי בהירות קריטיים ברשומה, היבט חשוב בניתוח משפטי יסודי.
במהלך הבדיקות האלה, גרסת טרום ההשקה של Gemini 2.5 Pro הציגה יכולות חזקות של הסקת מסקנות על סמך קלט שכלל מאות דפים של חומרי לימוד, תרחיש נפוץ בעבודה משפטית. בנוסף, הוא היה מסוגל להשתמש בחומרים האלה כדי ליצור פלט מקיף וארוך יותר, וכך לאפשר תובנות וניתוחים מעמיקים יותר. היכולות העיקריות האלה מדגישות את הפוטנציאל של גרסת טרום-ההשקה של Gemini 2.5 Pro בעבודה משפטית מורכבת שדורשת ניתוח של מערכי מסמכים גדולים כדי לתמוך בתרחישי שימוש של בדיקת נאותות, סקירה וניסוח.
סטנדרט חדש ל-AI משפטי
"אנחנו ב-Harvey מחויבים לספק לאנשי מקצוע בתחום המשפט את הכלים המתקדמים ביותר", אומר ניקו גרופן, ראש מחלקת AI יישומי ב-Harvey. "ההערכה שלנו של גרסת טרום-ההשקה של Gemini 2.5 Pro באמצעות BigLaw Bench חשפה את היכולת המדהימה שלו לסנתז מידע משפטי מורכב. התובנה הזו מחזקת את החזון שלנו לגבי פיתוח מוצרים בעתיד, שבו ננצל את היתרונות האלה כדי להשיג יעילות חסרת תקדים ולאפשר לעורכי דין להתמקד בעבודה אסטרטגית ברמה גבוהה יותר".
העתיד של עולם העבודה המשפטית
המחויבות של Harvey להערכה קפדנית והניתוח המעמיק שלהם של מודלים מתקדמים של AI כמו גרסת טרום-השקה של Gemini 2.5 Pro מדגימים את הפוטנציאל של AI בתחום המשפט. הממצאים שלהם סוללים את הדרך לחידושים עתידיים שישנו את הגישה של אנשי מקצוע בתחום המשפטים למשימות התובעניות ביותר שלהם.
כדי ללמוד איך יכולות הניתוח והסינתזה המתקדמות של Gemini 2.5 Pro Preview יכולות לשפר את האפליקציות שלכם, אפשר לעיין במאמרי העזרה של Gemini API או להתחיל להשתמש ב-Google AI Studio.
Harvey היא חברה ב-AI Futures Fund של Google, שמשקיעה בסטארטאפים שאפתניים ומשתפת איתם פעולה כדי לפתח את הדור הבא של טכנולוגיית ה-AI.