2025 年 5 月 16 日
Harvey:通过 BigLaw Bench 验证 Gemini 2.5 Pro 预览版的高级法律推理能力
Harvey:通过 BigLaw Bench 验证 Gemini 2.5 Pro 预览版的高级法律推理能力
法律行业需要能够精准而细致地处理海量复杂信息的 AI 解决方案。传统的 AI 基准测试往往无法反映法律实践的真实需求,因此很难识别真正能够胜任高价值法律工作的模型。Harvey 是一家致力于通过 AI 转变法律工作流程的活力四射的初创公司,该公司开发了 BigLaw Bench,这是一个用于评估大语言模型 (LLM) 在模拟实际法律工作的任务中的表现的综合框架,从而解决了这一问题。在最近的严格评估中,Gemini 2.5 Pro 预览版表现出色,展现出在关键法律领域提高效率的巨大潜力。
Gemini 2.5 Pro 预览版在 BigLaw 律师事务所中率先推出
Harvey 最近利用 BigLaw Bench 框架进行的评估清楚表明,Gemini 2.5 Pro 预览版在核心法律推理任务方面表现出卓越的熟练程度,尤其是在需要对长篇法律输入或输出进行推理的任务方面。正如 Harvey 公开分享的结果所示,通过各自的 API 对包括 Gemini 2.5 Pro 预览版在内的模型进行测试后,Gemini 2.5 Pro 预览版在 BigLaw Bench 上取得了 85.02% 的领先得分,优于此综合评估中评估的其他模型。
这项领先的功能对于各种高价值的法律活动至关重要。BigLaw Bench 中的关键评估任务展示了 Gemini 2.5 Pro 预览版的优势:
- 交易尽职调查:Gemini 2.5 Pro 预览版在从多份冗长的服务协议中提取和总结关键条款(例如转让、赔偿、终止条款)方面表现出了强大的能力。这表明,该模型有望大幅简化耗时的人工文档审核流程。
- 交易结构化:该模型能够熟练地生成对复杂金融方案(例如,PIPE、包销股权发行、债券发行)。该模型展现出良好的前景,能够以清晰易懂的方式呈现这些信息,即使对于那些没有深厚金融专业知识的人来说也是如此,并且还能提出潜在的立即行动方案。
- 诉讼文书起草:在与诉讼相关的任务评估中,Gemini 2.5 Pro 预览版展现出卓越的能力,能够根据大量简报文件生成详细的法律摘要大纲。这种能力预示着未来人工智能可以在法律论证发展和组织的初始阶段发挥重要作用。
- 文档审核和分析:在涉及审核各种试验文档(通话记录、电子邮件、备忘录)的评估中,Gemini 2.5 Pro 预览版在创建连贯的事件时间顺序摘要方面表现出色。此外,该模型在识别记录中的严重不一致和含糊不清之处方面展现出潜力,而这对于透彻的法律分析至关重要。
在这些评估中,Gemini 2.5 Pro 预览版在处理包含数百页材料的输入时展现了强大的推理能力,这在法律工作中是一种常见的情况。此外,它还能够使用这些材料生成长篇全面的输出,从而提供更深入的数据洞见和分析。这些核心功能突显了 Gemini 2.5 Pro 预览版在复杂法律工作中的潜力,该模型能够对大量文档进行推理,从而支持尽职调查、审核和起草用例。
法律 AI 的新标准
“在 Harvey,我们致力于为法律专业人士配备最先进的工具,”Harvey 应用人工智能主管 Niko Grupen 表示。“我们通过 BigLaw Bench 对 Gemini 2.5 Pro 预览版进行了评估,发现它在整合复杂的法律信息方面表现出色。这一洞见为我们未来的产品开发提供了动力,我们希望利用这些优势来释放前所未有的效率,并让律师能够专注于更高级别的战略性工作。”
开启法律工作的未来
Harvey 致力于进行严格的评估,并对 Gemini 2.5 Pro 预览版等尖端 AI 模型进行富有洞察力的分析,这表明 AI 在法律领域的变革潜力。他们的研究成果为未来的创新奠定了基础,有望改变法律专业人士处理最艰巨任务的方式。
如需了解 Gemini 2.5 Pro 预览版的先进推理和合成功能如何为您的应用赋能,请访问 Gemini API 文档或在 Google AI Studio 中开始使用。
Harvey 是 Google AI 启航资金的参与者,该基金会投资并携手富有雄心的初创公司,共同开创下一代 AI 技术。