Condividi

16 mag 2025

Harvey: Validating Gemini 2.5 Pro Preview’s Advanced Legal Reasoning with BigLaw Bench

Niko Grupen

Head of Applied AI

Vishal Dharmadhikari

AI DevRel

Hero della vetrina Toonsutra

Il settore legale richiede soluzioni di intelligenza artificiale in grado di gestire un immenso volume di informazioni complesse con precisione e sottigliezza. I tradizionali parametri di riferimento dell'intelligenza artificiale spesso non riescono a catturare le esigenze reali della pratica legale, rendendo difficile identificare modelli realmente in grado di svolgere un lavoro legale di alto valore. Harvey, una startup dinamica dedicata alla trasformazione dei workflow legali tramite l'AI, ha affrontato questo problema sviluppando BigLaw Bench, il suo framework completo per valutare le prestazioni dei modelli linguistici di grandi dimensioni (LLM) in attività che rispecchiano il lavoro legale effettivo. Nelle recenti valutazioni rigorose, l'anteprima di Gemini 2.5 Pro si è distinta per le sue prestazioni, dimostrando un potenziale eccezionale per migliorare l'efficienza in settori legali chiave.

Anteprima di Gemini 2.5 Pro su BigLaw Bench

Le recenti valutazioni di Harvey basate sul framework BigLaw Bench hanno chiaramente indicato che Gemini 2.5 Pro Preview dimostra una notevole competenza nelle principali attività di ragionamento giuridico e, in particolare, nelle attività che richiedono un ragionamento su input o output giuridici di lunga durata. Come mostrato nei risultati pubblicamente condivisi da Harvey, ottenuti testando modelli tra cui Gemini 2.5 Pro Preview tramite le rispettive API, Gemini 2.5 Pro Preview ha ottenuto il punteggio più alto, pari all'85,02%, su BigLaw Bench, superando gli altri modelli valutati in questa valutazione completa.

Testo alternativo: Grafico a barre intitolato

Questa funzionalità all'avanguardia è fondamentale per un'ampia gamma di attività legali di alto valore. Le attività di valutazione chiave all'interno di BigLaw Bench hanno messo in evidenza i punti di forza di Gemini 2.5 Pro Preview:

  • Due diligence transazionale: l'anteprima di Gemini 2.5 Pro ha dimostrato una forte capacità di estrarre e riassumere disposizioni critiche (ad es. clausole di cessione, indennizzo e risoluzione) da più contratti di servizio lunghi. Ciò suggerisce un potenziale significativo per semplificare il lungo processo di revisione manuale dei documenti.
  • Strutturazione delle transazioni: il modello ha generato abilmente analisi comparative complete e ben strutturate di opzioni finanziarie complesse (ad esempio, PIPE, offerte di azioni garantite, offerte di obbligazioni). Il modello si è dimostrato promettente nel presentare queste informazioni in modo chiaro e accessibile, anche per chi non ha competenze finanziarie approfondite, e nel suggerire potenziali azioni immediate.
  • Redazione di contenziosi: quando valutata in base alle attività relative ai contenziosi, Gemini 2.5 Pro Preview ha dimostrato una notevole capacità di generare schemi dettagliati per memorie legali basati su volumi considerevoli di documenti informativi. Questa capacità indica un futuro in cui l'intelligenza artificiale potrà fornire un contributo significativo nelle fasi iniziali dello sviluppo e dell'organizzazione delle argomentazioni legali.
  • Revisione e analisi dei documenti: le valutazioni che prevedono la revisione di documenti di prova disparati (log delle chiamate, email, memorandum) hanno rivelato la capacità di Gemini 2.5 Pro Preview di creare riepiloghi cronologici coerenti degli eventi. Inoltre, il modello ha dimostrato di avere potenzialità nell'individuare incongruenze e ambiguità critiche all'interno del fascicolo, un aspetto cruciale di un'analisi giuridica approfondita.


In queste valutazioni, Gemini 2.5 Pro Preview ha dimostrato una solida capacità di ragionamento su input costituiti da centinaia di pagine di materiali, uno scenario comune nel lavoro legale. Inoltre, era in grado di utilizzare questi materiali per generare output più lunghi e completi, consentendo approfondimenti e analisi più dettagliati. Queste funzionalità di base evidenziano il potenziale di sfruttamento di Gemini 2.5 Pro Preview in attività legali complesse che richiedono il ragionamento su grandi set di documenti per supportare casi d'uso di due diligence, revisione e stesura.

"In Harvey, ci impegniamo a fornire ai professionisti legali gli strumenti più avanzati", afferma Niko Grupen, Head of Applied AI di Harvey. "La nostra valutazione di Gemini 2.5 Pro Preview tramite BigLaw Bench ha rivelato la sua straordinaria capacità di sintetizzare informazioni legali complesse. Questo approfondimento alimenta la nostra visione per lo sviluppo futuro dei prodotti, in cui miriamo a sfruttare questi punti di forza per ottenere un'efficienza senza precedenti e consentire agli avvocati di concentrarsi su un lavoro strategico di livello superiore".

L'impegno di Harvey per una valutazione rigorosa e la sua analisi approfondita di modelli di AI all'avanguardia come Gemini 2.5 Pro Preview dimostrano il potenziale trasformativo dell'AI nel settore legale. I loro risultati aprono la strada a future innovazioni che promettono di rimodellare il modo in cui i professionisti legali affrontano i loro compiti più impegnativi.

Per scoprire come le funzionalità avanzate di ragionamento e sintesi di Gemini 2.5 Pro Preview possono potenziare le tue applicazioni, consulta la documentazione dell'API Gemini o inizia a utilizzare Google AI Studio.

Harvey partecipa al Google's AI Futures Fund, che investe e collabora con startup ambiziose che stanno costruendo il futuro dell'AI.