שיתוף

‫16 במאי 2025

‫Harvey: אימות של יכולות הנימוק המשפטי המתקדם של Gemini 2.5 Pro Preview באמצעות BigLaw Bench

Niko Grupen

ראש מחלקת AI יישומי

וישאל דהרמדיקארי

AI DevRel

תמונה ראשית (Hero) של Toonsutra

בענף המשפטים יש דרישה לפתרונות AI שיכולים להתמודד עם נפח עצום של מידע מורכב בצורה מדויקת ועם הבנה של ניואנסים. בדרך כלל, מדדי ביצועים מסורתיים של AI לא מצליחים לשקף את הדרישות של עבודה משפטית בעולם האמיתי, ולכן קשה לזהות מודלים שיכולים לבצע עבודה משפטית בעלת ערך גבוה. חברת הסטארט-אפ הדינמית Harvey, שמתמקדת בשינוי תהליכי עבודה משפטיים באמצעות AI, התמודדה עם האתגר הזה באמצעות פיתוח BigLaw Bench, מסגרת מקיפה להערכת הביצועים של מודלים גדולים של שפה (LLM) במשימות שמשקפות עבודה משפטית בפועל. בבדיקות המקיפות שנערכו לאחרונה, מודל Gemini 2.5 Pro Preview בלט בביצועים שלו והוכיח פוטנציאל יוצא דופן לשיפור היעילות בתחומים משפטיים מרכזיים.

‫Gemini 2.5 Pro Preview מוביל ב-BigLaw Bench

ההערכות האחרונות של הארווי, שמבוססות על מסגרת BigLaw Bench, מצביעות בבירור על כך שגרסת טרום ההשקה של Gemini 2.5 Pro מפגינה רמת מיומנות יוצאת דופן במשימות ליבה של הסקת מסקנות משפטיות, ובמיוחד במשימות שדורשות הסקת מסקנות על קלט או פלט משפטיים ארוכים. כפי שניתן לראות בתוצאות ששותפו באופן ציבורי על ידי Harvey, שהתקבלו מבדיקת מודלים כולל גרסת הטרום-השקה של Gemini 2.5 Pro דרך ממשקי ה-API שלהם, גרסת הטרום-השקה של Gemini 2.5 Pro השיגה את הציון המוביל של 85.02% ב-BigLaw Bench, והייתה טובה יותר ממודלים אחרים שנבדקו בהערכה המקיפה הזו.

טקסט חלופי: תרשים עמודות שכותרתו

היכולת המתקדמת הזו חיונית למגוון רחב של פעילויות משפטיות בעלות ערך גבוה. משימות מרכזיות להערכה ב-BigLaw Bench הציגו את היתרונות של Gemini 2.5 Pro Preview:

  • בדיקת נאותות של עסקאות: גרסת הטרום-השקה של Gemini 2.5 Pro הראתה יכולת גבוהה לחילוץ סיכום של סעיפים חשובים (למשל, סעיפים בנושא הקצאה, שיפוי וסיום) מכמה הסכמי שירות ארוכים. המשמעות היא שיש פוטנציאל משמעותי לייעל את התהליך הממושך של בדיקת מסמכים ידנית.
  • תכנון עסקאות: המודל יצר ניתוחים השוואתיים מקיפים ומובנים היטב של אפשרויות פיננסיות מורכבות (למשל, ‫PIPE, הנפקות מניות בהתחייבות חיתום, הנפקות אג"ח). המודל הראה פוטנציאל בהצגת המידע הזה בצורה ברורה ונגישה, גם למי שאין לו מומחיות פיננסית עמוקה, ובהצעת פעולות מיידיות אפשריות.
  • ניסוח מסמכים משפטיים: כשנבדק בביצוע משימות שקשורות לליטיגציה, מודל Gemini 2.5 Pro Preview הראה יכולת מרשימה ליצור תקצירים מפורטים של טיעונים משפטיים על סמך כמויות גדולות של מסמכי תדרוך. היכולת הזו מצביעה על עתיד שבו AI יכול לעזור באופן משמעותי בשלבים הראשוניים של פיתוח וארגון טיעונים משפטיים.
  • בדיקה וניתוח של מסמכים: הערכות שכללו בדיקה של מסמכים שונים מניסויים (יומני שיחות, אימיילים, תזכירים) הראו את היכולת של Gemini 2.5 Pro Preview ליצור סיכומים כרונולוגיים עקביים של אירועים. בנוסף, המודל הראה פוטנציאל בזיהוי חוסר עקביות ואי בהירות קריטיים ברשומה, היבט חשוב בניתוח משפטי יסודי.


במהלך הבדיקות האלה, גרסת התצוגה המקדימה של Gemini 2.5 Pro הציגה יכולות חזקות של הסקת מסקנות על סמך קלט שכלל מאות דפים של חומרי לימוד, תרחיש נפוץ בעבודה משפטית. בנוסף, הוא היה מסוגל להשתמש בחומרים האלה כדי ליצור פלט מקיף וארוך יותר, וכך לאפשר תובנות וניתוחים מעמיקים יותר. היכולות העיקריות האלה מדגישות את הפוטנציאל של Gemini 2.5 Pro Preview בעבודה משפטית מורכבת שדורשת הסקת מסקנות על מערכי מסמכים גדולים, כדי לתמוך בתרחישי שימוש של בדיקת נאותות, סקירה וניסוח.

"אנחנו ב-Harvey מחויבים לספק לאנשי מקצוע בתחום המשפט את הכלים המתקדמים ביותר", אומר ניקו גרופן, ראש מחלקת AI יישומי ב-Harvey. "ההערכה שלנו לגבי גרסת הטרום-השקה של Gemini 2.5 Pro באמצעות BigLaw Bench חשפה את היכולת המדהימה שלו לסנתז מידע משפטי מורכב. התובנה הזו מחזקת את החזון שלנו לגבי פיתוח מוצרים בעתיד, שבו ננצל את היתרונות האלה כדי להשיג יעילות חסרת תקדים ולאפשר לעורכי דין להתמקד בעבודה אסטרטגית ברמה גבוהה יותר".

המחויבות של Harvey להערכה קפדנית ולניתוח מעמיק של מודלים מתקדמים של AI כמו Gemini 2.5 Pro Preview מדגימה את הפוטנציאל של AI בתחום המשפט. הממצאים שלהם סוללים את הדרך לחידושים עתידיים שישנו את האופן שבו אנשי מקצוע בתחום המשפטים ניגשים למשימות התובעניות ביותר שלהם.

כדי לראות איך יכולות הניתוח והסינתזה המתקדמות של Gemini 2.5 Pro Preview יכולות לשפר את האפליקציות שלכם, אפשר לעיין במסמכי התיעוד של Gemini API או להתחיל להשתמש ב-Google AI Studio.

חברת Harvey משתתפת בקרן AI Futures של Google, שמשקיעה בסטארטאפים שאפתניים ומשתפת איתם פעולה כדי לבנות את הדור הבא של טכנולוגיית ה-AI.