2025 年 5 月 16 日
Harvey:使用 BigLaw 基準驗證 Gemini 2.5 Pro 搶先版的進階法律推論功能
Harvey:透過 BigLaw Bench 驗證 Gemini 2.5 Pro 搶先版的進階法律推論能力
法律產業需要 AI 解決方案,協助他們精準且細緻地處理大量複雜資訊。傳統 AI 基準通常無法充分反映法律實務的實際需求,因此難以找出真正能勝任高價值法律工作的模型。Harvey 是一家充滿活力的新創公司,致力於透過 AI 轉型法律工作流程。為解決這個問題,他們開發了 BigLaw Bench,這是一套全面的架構,用於評估大型語言模型 (LLM) 在模擬實際法律工作的任務中的表現。在最近的嚴格評估中,Gemini 2.5 Pro 預先發布版表現出色,展現出在重要法律領域提高效率的卓越潛力。
Gemini 2.5 Pro 預先發布版在 BigLaw 基準測試中領先
Harvey 最近採用 BigLaw Bench 架構進行的評估清楚指出,Gemini 2.5 Pro 搶先版在核心法律推理工作方面展現卓越能力,尤其是在需要對長篇法律輸入內容或輸出內容進行推理的工作。如 Harvey 公開分享的結果所示,透過各自的 API 測試包括 Gemini 2.5 Pro 預先發布版在內的模型後,Gemini 2.5 Pro 預先發布版在 BigLaw Bench 獲得 85.02% 的最高分數,優於這項全面評估中測試的其他模型。
這項領先業界的功能對於各種高價值法律活動至關重要。在 BigLaw Bench 的主要評估工作中,Gemini 2.5 Pro 預先發布版展現了以下優勢:
- 交易盡職調查:Gemini 2.5 Pro 搶先版展現了強大的能力,可從多份冗長服務協議中擷取並摘要重要條款 (例如轉讓、賠償、終止條款)。這表明,簡化耗時的人工文件審核流程具有很大的潛力。
- 交易結構:此模型能夠巧妙地產生對複雜金融選擇(例如, PIPE、承銷股權發行、債券發行)。模型在清楚易懂地呈現這項資訊方面展現潛力,即使是沒有深入財務專業知識的人也能理解,並建議可立即採取的行動。
- 草擬訴訟文件:在與訴訟相關的評估作業中,Gemini 2.5 Pro Preview 展現出卓越能力,可根據大量簡報文件,生成法律摘要的詳細大綱。這項功能預示著 AI 在法律論證的初步開發和組織階段,將能發揮重大作用。
- 文件審查與分析:在審查各種試驗文件 (通話記錄、電子郵件、備忘錄) 的評估過程中,我們發現 Gemini 2.5 Pro 搶先版能有效歸納事件的連貫時間軸摘要。此外,模型也展現出識別記錄中重大不一致和模糊不清之處的潛力,這是徹底法律分析的重要環節。
在這些評估中,Gemini 2.5 Pro Preview 展現了強大的推理能力,能夠處理包含數百頁資料的輸入,這是法律工作中常見的場景。此外,它還能夠利用這些材料產生更長篇幅、更全面的輸出,從而進行更深入的洞察和分析。這些核心功能凸顯了 Gemini 2.5 Pro Preview 在複雜的法律工作中發揮的潛力,這些工作需要對大量文件進行推理,以支援盡職調查、審查和起草用例。
法律 AI 的新標準
「在 Harvey,我們致力於為法律專業人士配備最先進的工具,」Harvey 應用人工智慧主管 Niko Grupen 表示。「我們透過 BigLaw Bench 評估 Gemini 2.5 Pro 搶先版,發現這款模型整合複雜法律資訊的能力十分出色。這項洞察為我們未來的產品開發提供了靈感,我們旨在利用這些優勢,釋放前所未有的效率,使律師能夠專注於更高層次的策略工作。
解鎖法律工作的未來
Harvey 致力於嚴格評估,並深入分析 Gemini 2.5 Pro 搶先體驗版等先進 AI 模型,展現 AI 在法律領域的變革潛力。他們的發現為未來的創新奠定基礎,有望重塑法律專業人士處理最艱鉅工作的方式。
如要瞭解 Gemini 2.5 Pro 搶先版的進階推理和綜合能力如何為您的應用程式提供強大支援,請參閱 Gemini API 說明文件,或在 Google AI Studio 中開始使用。
Harvey 是 Google 的 AI Futures Fund 的參與者,該基金投資並與雄心勃勃的新創公司合作,共同打造人工智慧的未來。