Harvey: Validating Gemini 2.5 Pro Preview’s Advanced Legal Reasoning with BigLaw Bench

Niko Grupen

Head of Applied AI

Vishal Dharmadhikari

AI DevRel

Harvey: Validating Gemini 2.5 Pro Preview’s Advanced Legal Reasoning with BigLaw Bench

Il settore legale richiede soluzioni di AI in grado di gestire un volume immenso di informazioni complesse con precisione e sfumature. I benchmark tradizionali dell'AI spesso non riescono a cogliere le esigenze reali della pratica legale, rendendo difficile identificare i modelli veramente capaci di svolgere un lavoro legale di alto valore. Harvey, una startup dinamica dedicata alla trasformazione dei workflow legali tramite l'AI, ha affrontato questo problema sviluppando BigLaw Bench, il suo framework completo per valutare le prestazioni dei modelli linguistici di grandi dimensioni (LLM) in attività che rispecchiano il lavoro legale effettivo. Nelle recenti valutazioni rigorose, l'anteprima di Gemini 2.5 Pro si è distinta per le sue prestazioni, dimostrando un potenziale eccezionale per migliorare l'efficienza in settori legali chiave.

Anteprima di Gemini 2.5 Pro su BigLaw Bench

Le recenti valutazioni di Harvey che utilizzano il framework BigLaw Bench hanno chiaramente indicato che Gemini 2.5 Pro Preview dimostra una notevole competenza nelle attività di ragionamento legale di base e, in particolare, nelle attività che richiedono il ragionamento su input o output legali in formato lungo. Come mostrato nei risultati condivisi pubblicamente da Harvey, ottenuti testando modelli tra cui Gemini 2.5 Pro Preview tramite le rispettive API, Gemini 2.5 Pro Preview ha ottenuto il punteggio più alto, pari all'85,02%, su BigLaw Bench, superando gli altri modelli valutati in questa valutazione completa.

Testo alternativo: grafico a barre con titolo

Questa funzionalità all'avanguardia è fondamentale per un'ampia gamma di attività legali di alto valore. Le attività di valutazione chiave all'interno di BigLaw Bench hanno messo in evidenza i punti di forza di Gemini 2.5 Pro Preview:

Due diligence transazionale: l'anteprima di Gemini 2.5 Pro ha dimostrato una forte capacità di estrarre e riassumere disposizioni critiche (ad es. clausole di cessione, indennizzo e risoluzione) da più contratti di servizio lunghi. Ciò suggerisce un potenziale significativo per semplificare il processo manuale di revisione dei documenti, che richiede molto tempo.
Strutturazione delle transazioni: il modello ha generato in modo efficace analisi comparative complete e ben strutturate di complesse opzioni finanziarie (ad es. PIPE, offerte di azioni garantite, offerte di obbligazioni). Il modello si è dimostrato promettente nel presentare queste informazioni in modo chiaro e accessibile, anche per chi non ha competenze finanziarie approfondite, e nel suggerire potenziali azioni immediate.
Redazione di documenti processuali: quando è stato valutato in attività relative a controversie, Gemini 2.5 Pro Preview ha mostrato una notevole capacità di generare schemi dettagliati per le memorie legali basati su volumi sostanziali di documenti di briefing. Questa funzionalità indica un futuro in cui l'AI può contribuire in modo significativo alle fasi iniziali di sviluppo e organizzazione degli argomenti legali.
Revisione e analisi dei documenti: le valutazioni che prevedono la revisione di documenti di prova disparati (registri delle chiamate, email, memorandum) hanno rivelato la capacità di Gemini 2.5 Pro Preview di creare riepiloghi cronologici coerenti degli eventi. Inoltre, il modello ha mostrato un potenziale nell'identificazione di incoerenze e ambiguità critiche all'interno del record, un aspetto cruciale di un'analisi legale approfondita.

In queste valutazioni, Gemini 2.5 Pro Preview ha dimostrato una solida capacità di ragionamento su input costituiti da centinaia di pagine di materiali, uno scenario comune nel lavoro legale. Inoltre, era in grado di utilizzare questi materiali per generare output più lunghi e completi, consentendo approfondimenti e analisi più dettagliati. Queste funzionalità di base evidenziano il potenziale di sfruttamento di Gemini 2.5 Pro Preview in attività legali complesse che richiedono il ragionamento su grandi set di documenti per supportare casi d'uso di due diligence, revisione e stesura.

Un nuovo standard per l'AI legale

"In Harvey, ci impegniamo a fornire ai professionisti legali gli strumenti più avanzati", afferma Niko Grupen, Head of Applied AI di Harvey. "La nostra valutazione di Gemini 2.5 Pro Preview tramite BigLaw Bench ha rivelato la sua straordinaria capacità di sintetizzare informazioni legali complesse. Questo approfondimento alimenta la nostra visione per lo sviluppo futuro dei prodotti, in cui miriamo a sfruttare questi punti di forza per ottenere un'efficienza senza precedenti e consentire agli avvocati di concentrarsi su un lavoro strategico di livello superiore".

Sbloccare il futuro del lavoro legale

L'impegno di Harvey per una valutazione rigorosa e la sua analisi approfondita di modelli di AI all'avanguardia come Gemini 2.5 Pro Preview dimostrano il potenziale trasformativo dell'AI nel settore legale. I loro risultati aprono la strada a future innovazioni che promettono di rimodellare il modo in cui i professionisti legali affrontano i loro compiti più impegnativi.

Per scoprire come le funzionalità avanzate di ragionamento e sintesi di Gemini 2.5 Pro Preview possono migliorare le tue applicazioni, consulta la documentazione dell'API Gemini o inizia a utilizzare Google AI Studio.

Harvey partecipa al Google's AI Futures Fund, che investe e collabora con startup ambiziose che stanno costruendo il futuro dell'AI.

Harvey: Validating Gemini 2.5 Pro Preview’s Advanced Legal Reasoning with BigLaw Bench

Harvey: Validating Gemini 2.5 Pro Preview’s Advanced Legal Reasoning with BigLaw Bench

Anteprima di Gemini 2.5 Pro su BigLaw Bench

Un nuovo standard per l'AI legale

Sbloccare il futuro del lavoro legale

Case study correlati