Делиться

16 мая 2025 г.

Харви: Проверка расширенного юридического обоснования Gemini 2.5 Pro Preview с помощью BigLaw Bench

Нико Группен

Руководитель отдела прикладного ИИ

Вишал Дхармадхикари

AI DevRel

Герой выставки Toonsutra

Юридическая отрасль нуждается в решениях на основе ИИ, способных обрабатывать огромные объёмы сложной информации с точностью и детализацией. Традиционные бенчмарки ИИ часто не отражают реальных потребностей юридической практики, что затрудняет выявление моделей, действительно способных выполнять высокоэффективную юридическую работу. Harvey, динамичный стартап, занимающийся трансформацией юридических рабочих процессов с помощью ИИ, решил эту проблему, разработав BigLaw Bench — комплексную платформу для оценки эффективности работы с большими языковыми моделями (LLM) в задачах, имитирующих реальную юридическую работу. В ходе недавних строгих испытаний Gemini 2.5 Pro Preview показала выдающиеся результаты, продемонстрировав исключительный потенциал для повышения эффективности в ключевых юридических областях.

Gemini 2.5 Pro Preview лидирует на скамье подсудимых BigLaw

Недавние оценки Harvey, использующие фреймворк BigLaw Bench, однозначно показали, что Gemini 2.5 Pro Preview демонстрирует выдающуюся эффективность в решении основных задач юридического обоснования, в частности, задач, требующих обоснования развернутых юридических данных. Как показывают опубликованные Harvey результаты, полученные путем тестирования моделей, включая Gemini 2.5 Pro Preview, через соответствующие API, Gemini 2.5 Pro Preview достигла наивысшего результата в 85,02% в BigLaw Bench, превзойдя другие модели, рассмотренные в рамках этой комплексной оценки.

Альтернативный текст: Столбчатая диаграмма с заголовком

Эта передовая возможность критически важна для широкого спектра высокодоходных юридических услуг. Ключевые задачи оценки в рамках BigLaw Bench продемонстрировали сильные стороны Gemini 2.5 Pro Preview:

  • Транзакционная проверка : Gemini 2.5 Pro Preview продемонстрировала высокую способность извлекать и обобщать критически важные положения (например, положения об уступке, возмещении ущерба, расторжении договора) из нескольких объемных договоров на оказание услуг. Это свидетельствует о значительном потенциале для оптимизации трудоемкого процесса ручной проверки документов.
  • Структурирование транзакций : Модель умело сгенерировала комплексный, хорошо структурированный сравнительный анализ сложных финансовых опционов (например, PIPE, гарантированные размещения акций, размещения облигаций). Модель продемонстрировала многообещающие возможности представления этой информации в понятной и доступной форме, даже для тех, кто не обладает глубокими финансовыми знаниями, и предлагала возможные первоочередные действия.
  • Составление судебных документов : При оценке задач, связанных с судебными разбирательствами, Gemini 2.5 Pro Preview продемонстрировал впечатляющую способность генерировать подробные планы юридических заключений на основе значительных объёмов документов. Эта способность указывает на будущее, в котором ИИ сможет существенно помочь на начальных этапах разработки и организации юридических аргументов.
  • Анализ и проверка документов : Анализ разрозненных судебных документов (журналов вызовов, электронных писем, меморандумов) выявил сильные стороны Gemini 2.5 Pro Preview в создании связных хронологических изложений событий. Кроме того, модель продемонстрировала потенциал для выявления критических несоответствий и двусмысленностей в материалах дела, что является важнейшим аспектом тщательного юридического анализа.


В ходе этих оценок Gemini 2.5 Pro Preview продемонстрировал убедительную аргументацию при анализе сотен страниц исходных материалов, что является распространённой ситуацией в юридической работе. Кроме того, программа могла использовать эти материалы для создания более объёмных и подробных результатов, что позволило проводить более глубокий анализ и понимание сути вопроса. Эти основные возможности подчёркивают потенциал Gemini 2.5 Pro Preview для решения сложных юридических задач, требующих обоснования больших объёмов документов, для поддержки проверки, рецензирования и составления проектов.

«В Harvey мы стремимся оснастить юристов самыми передовыми инструментами», — заявляет Нико Группен, руководитель отдела прикладного искусственного интеллекта Harvey. «Наша оценка Gemini 2.5 Pro Preview с помощью BigLaw Bench выявила его выдающуюся способность синтезировать сложную юридическую информацию. Это понимание подкрепляет наше видение будущего развития продукта, в котором мы стремимся использовать эти сильные стороны для достижения беспрецедентной эффективности и предоставления юристам возможности сосредоточиться на более важной стратегической работе».

Приверженность Harvey к строгой оценке и глубокий анализ передовых моделей ИИ, таких как Gemini 2.5 Pro Preview, демонстрируют преобразующий потенциал ИИ в юридической сфере. Результаты исследований прокладывают путь для будущих инноваций, которые обещают изменить подход юристов к решению самых сложных задач.

Чтобы узнать, как расширенные возможности рассуждений и синтеза Gemini 2.5 Pro Preview могут помочь вашим собственным приложениям, ознакомьтесь с документацией API Gemini или начните работу в Google AI Studio .

Харви является участником фонда Google AI Futures Fund , который инвестирует в амбициозные стартапы, разрабатывающие будущие решения в области искусственного интеллекта, и сотрудничает с ними.

Залп

Volley использует Gemini 2.5 Pro для ускорения процесса разработки игр, создавая захватывающие приключения в подземельях с голосовым управлением ИИ и визуальными эффектами от Gemini 2.0 Flash и Veo 2.