16 de maio de 2025
Harvey: Validação do raciocínio jurídico avançado da prévia do Gemini 2.5 Pro com o BigLaw Bench

Harvey: Validação do raciocínio jurídico avançado da prévia do Gemini 2.5 Pro com o BigLaw Bench
O setor jurídico exige soluções de IA que possam navegar por um imenso volume de informações complexas com precisão e nuances. Os comparativos tradicionais de IA geralmente não conseguem capturar as demandas reais da prática jurídica, o que dificulta a identificação de modelos realmente capazes de realizar trabalhos jurídicos de alto valor. A Harvey, uma startup dinâmica dedicada a transformar fluxos de trabalho jurídicos com IA, enfrentou esse problema desenvolvendo a BigLaw Bench, um framework abrangente para avaliar o desempenho do modelo de linguagem grande (LLM) em tarefas que refletem o trabalho jurídico real. Nas avaliações rigorosas recentes, o Gemini 2.5 Pro (prévia) se destacou, demonstrando um potencial excepcional para melhorar a eficiência em domínios jurídicos importantes.
O Gemini 2.5 Pro lidera a BigLaw Bench
As avaliações recentes de Harvey usando o framework BigLaw Bench indicaram claramente que a prévia do Gemini 2.5 Pro demonstra uma proficiência notável nas principais tarefas de raciocínio jurídico e, em particular, nas tarefas que exigem raciocínio sobre entradas ou saídas jurídicas longas. Como mostrado nos resultados compartilhados publicamente por Harvey, obtidos ao testar modelos, incluindo o Gemini 2.5 Pro Preview, usando as respectivas APIs, o Gemini 2.5 Pro Preview alcançou a pontuação líder de 85,02% no BigLaw Bench, superando outros modelos avaliados nesta avaliação abrangente.

Esse recurso é crucial para uma ampla gama de atividades jurídicas de alto valor. As principais tarefas de avaliação no BigLaw Bench mostraram os pontos fortes da prévia do Gemini 2.5 Pro:
- Diligence prévia de transações: a prévia do Gemini 2.5 Pro mostrou uma grande capacidade de extrair e resumir as disposições importantes (por exemplo, atribuição, indenização, cláusulas de rescisão) de vários contratos de serviço longos. Isso sugere um potencial significativo para agilizar o processo de revisão manual de documentos, que consome muito tempo.
- Estruturação de transações: o modelo gerou análises comparativas abrangentes e bem estruturadas de opções financeiras complexas (por exemplo, PIPE, ofertas de ações subscritas, ofertas de títulos). O modelo mostrou promessa em apresentar essas informações de maneira clara e acessível, mesmo para pessoas sem experiência financeira, e em sugerir possíveis itens de ação imediata.
- Elaboração de processos judiciais: quando avaliada em tarefas relacionadas a processos judiciais, a visualização do Gemini 2.5 Pro mostrou uma capacidade notável de gerar esquemas detalhados para petições iniciais com base em volumes substanciais de documentos de instruções. Esse recurso aponta para um futuro em que a IA pode ajudar significativamente nas fases iniciais de desenvolvimento e organização de argumentos jurídicos.
- Análise e revisão de documentos: as avaliações que envolveram a revisão de documentos de teste diferentes (registros de chamadas, e-mails, memorandos) revelaram a força da Gemini 2.5 Pro Preview na criação de resumos cronológicos coerentes de eventos. Além disso, o modelo mostrou potencial para identificar inconsistências e ambiguidades críticas no registro, um aspecto crucial da análise jurídica completa.
Nas avaliações, a prévia do Gemini 2.5 Pro demonstrou um raciocínio forte em entradas que consistiam em centenas de páginas de materiais, um cenário comum em trabalhos jurídicos. Além disso, ele foi capaz de usar esses materiais para gerar resultados mais longos e abrangentes, permitindo insights e análises mais aprofundados. Esses recursos principais destacam o potencial de aproveitar a prévia do Gemini 2.5 Pro em trabalhos jurídicos complexos que exigem raciocínio sobre grandes conjuntos de documentos para apoiar casos de diligência, revisão e redação.
Um novo padrão para a IA jurídica
"Na Harvey, temos o compromisso de oferecer aos profissionais do direito as ferramentas mais avançadas", afirma Niko Grupen, chefe de IA aplicada da Harvey. "Nossa avaliação da prévia do Gemini 2.5 Pro pela BigLaw Bench revelou a capacidade notável de sintetizar informações jurídicas complexas. Esse insight alimenta nossa visão para o desenvolvimento de produtos futuros, em que queremos aproveitar esses pontos fortes para alcançar uma eficiência sem precedentes e permitir que os advogados se concentrem em trabalhos estratégicos de alto nível."
O futuro do trabalho jurídico
O compromisso de Harvey com a avaliação rigorosa e a análise perspicaz de modelos de IA de última geração, como o Gemini 2.5 Pro (pré-lançamento), demonstram o potencial transformador da IA no campo jurídico. As descobertas deles abrem caminho para inovações futuras que prometem reformular a forma como os profissionais jurídicos abordam as tarefas mais exigentes.
Para saber como os recursos avançados de raciocínio e síntese do Gemini 2.5 Pro Preview podem impulsionar seus próprios aplicativos, acesse a documentação da API Gemini ou comece a usar o Google AI Studio.
Harvey é participante do Google’s AI Futures Fund, que investe e colabora com startups ambiciosas que desenvolvem a próxima etapa da IA.