Harvey: Validando o raciocínio jurídico avançado da prévia do Gemini 2.5 Pro com o BigLaw Bench

Niko Grupen

Diretor de IA aplicada

Vishal Dharmadhikari

DevRel de IA

Imagem principal da vitrine do Toonsutra

Harvey: Validando o raciocínio jurídico avançado da prévia do Gemini 2.5 Pro com o BigLaw Bench

O setor jurídico exige soluções de IA que possam navegar por um imenso volume de informações complexas com precisão e sutileza. Os comparativos de mercado tradicionais de IA geralmente não capturam as demandas do mundo real da prática jurídica, o que dificulta a identificação de modelos realmente capazes de realizar trabalhos jurídicos de alto valor. A Harvey, uma startup dinâmica dedicada a transformar fluxos de trabalho jurídicos com IA, enfrentou esse problema ao desenvolver o BigLaw Bench, uma estrutura abrangente para avaliar a performance de modelos de linguagem grandes (LLMs) em tarefas que espelham o trabalho jurídico real. Nas avaliações rigorosas recentes, a prévia do Gemini 2.5 Pro se destacou, demonstrando um potencial excepcional para melhorar a eficiência em áreas jurídicas importantes.

O pré-lançamento do Gemini 2.5 Pro lidera o BigLaw Bench

As avaliações recentes do Harvey usando a estrutura BigLaw Bench indicaram claramente que a prévia do Gemini 2.5 Pro demonstra uma proficiência notável em tarefas principais de raciocínio jurídico e, em particular, tarefas que exigem raciocínio sobre entradas ou saídas jurídicas longas. Conforme mostrado nos resultados compartilhados publicamente pela Harvey, obtidos testando modelos, incluindo o Gemini 2.5 Pro (prévia) pelas respectivas APIs, o Gemini 2.5 Pro (prévia) alcançou a pontuação líder de 85,02% no BigLaw Bench, superando outros modelos avaliados nessa avaliação abrangente.

Texto alternativo: gráfico de barras chamado

Esse recurso líder é crucial para uma ampla variedade de atividades jurídicas de alto valor. As principais tarefas de avaliação no BigLaw Bench mostraram os pontos fortes da prévia do Gemini 2.5 Pro:

Due diligence transacional: o pré-lançamento do Gemini 2.5 Pro mostrou uma grande capacidade de extrair e resumir disposições críticas (por exemplo, cessão, indenização, cláusulas de rescisão) de vários contratos de serviços longos. Isso sugere um potencial significativo para simplificar o processo demorado de revisão manual de documentos.
Estruturação de transações: o modelo gerou análises comparativas abrangentes e bem estruturadas de opções financeiras complexas (por exemplo, PIPE, ofertas de ações subscritas, ofertas de títulos). O modelo mostrou ser promissor ao apresentar essas informações de maneira clara e acessível, mesmo para quem não tem muita experiência financeira, e ao sugerir possíveis ações imediatas.
Elaboração de petições iniciais: ao ser avaliado em tarefas relacionadas a litígios, o Gemini 2.5 Pro Preview mostrou uma capacidade notável de gerar esboços detalhados para petições iniciais com base em grandes volumes de documentos de instrução. Essa capacidade aponta para um futuro em que a IA pode ajudar significativamente nas etapas iniciais de desenvolvimento e organização de argumentos jurídicos.
Análise e revisão de documentos: as avaliações que envolvem a revisão de documentos de teste diferentes (registros de chamadas, e-mails, memorandos) revelaram a capacidade da Prévia do Gemini 2.5 Pro de criar resumos cronológicos coerentes de eventos. Além disso, o modelo mostrou potencial para identificar inconsistências e ambiguidades críticas no registro, um aspecto crucial de uma análise jurídica completa.

Em todas essas avaliações, o Gemini 2.5 Pro Preview mostrou um raciocínio forte em entradas que consistem em centenas de páginas de materiais, um cenário comum no trabalho jurídico. Além disso, ele conseguiu usar esses materiais para gerar resultados mais longos e abrangentes, permitindo insights e análises mais profundos. Esses recursos principais destacam o potencial de usar o Gemini 2.5 Pro em pré-lançamento em trabalhos jurídicos complexos que exigem raciocínio sobre grandes conjuntos de documentos para apoiar casos de uso de diligência, revisão e redação.

Um novo padrão para IA jurídica

"Na Harvey, temos o compromisso de equipar os profissionais do direito com as ferramentas mais avançadas", afirma Niko Grupen, chefe de IA aplicada da Harvey. "Nossa avaliação do Gemini 2.5 Pro Preview usando o BigLaw Bench revelou a capacidade notável dele de sintetizar informações jurídicas complexas. Esse insight alimenta nossa visão para o desenvolvimento de produtos futuros, em que pretendemos aproveitar esses pontos fortes para alcançar uma eficiência sem precedentes e permitir que os advogados se concentrem em trabalhos estratégicos de nível superior".

Como aproveitar o futuro do trabalho jurídico

O compromisso da Harvey com a avaliação rigorosa e a análise perspicaz de modelos de IA de ponta, como o Gemini 2.5 Pro Preview, demonstram o potencial transformador da IA no campo jurídico. As descobertas deles abrem caminho para futuras inovações que prometem mudar a forma como os profissionais do direito abordam as tarefas mais exigentes.

Para saber como os recursos avançados de raciocínio e síntese da prévia do Gemini 2.5 Pro podem impulsionar seus próprios aplicativos, acesse a documentação da API Gemini ou comece a usar o Google AI Studio.

A Harvey participa do AI Futures Fund do Google, que investe e colabora com startups ambiciosas que estão construindo o futuro da IA.

Harvey: Validando o raciocínio jurídico avançado da prévia do Gemini 2.5 Pro com o BigLaw Bench

Harvey: Validando o raciocínio jurídico avançado da prévia do Gemini 2.5 Pro com o BigLaw Bench

O pré-lançamento do Gemini 2.5 Pro lidera o BigLaw Bench

Um novo padrão para IA jurídica

Como aproveitar o futuro do trabalho jurídico

Estudos de caso relacionados