Bagikan

16 Mei 2025

Harvey: Memvalidasi Penalaran Hukum Tingkat Lanjut Pratinjau Gemini 2.5 Pro dengan BigLaw Bench

Niko Grupen

Head of Applied AI

Vishal Dharmadhikari

AI DevRel

Banner besar showcase Toonsutra

Industri hukum memerlukan solusi AI yang dapat menavigasi volume informasi kompleks yang sangat besar dengan presisi dan nuansa. Tolok ukur AI tradisional sering kali tidak dapat mencakup tuntutan praktik hukum di dunia nyata, sehingga sulit untuk mengidentifikasi model yang benar-benar mampu melakukan pekerjaan hukum bernilai tinggi. Harvey, sebuah startup dinamis yang berfokus untuk mengubah alur kerja hukum melalui AI, menghadapi tantangan ini dengan mengembangkan BigLaw Bench, yaitu framework komprehensif mereka untuk menilai performa Model Bahasa Besar (LLM) pada tugas yang mencerminkan pekerjaan hukum yang sebenarnya. Dalam evaluasi ketat baru-baru ini, Pratinjau Gemini 2.5 Pro muncul sebagai yang berkinerja paling baik, yang menunjukkan potensi luar biasa untuk meningkatkan efisiensi dalam domain hukum utama.

Pratinjau Gemini 2.5 Pro di BigLaw Bench

Evaluasi terbaru Harvey yang memanfaatkan framework BigLaw Bench telah menunjukkan dengan jelas bahwa Pratinjau Gemini 2.5 Pro menunjukkan kemahiran yang luar biasa dalam tugas penalaran hukum inti dan, khususnya, tugas yang memerlukan penalaran atas input atau output hukum bentuk panjang. Seperti yang ditunjukkan dalam hasil yang dibagikan secara publik oleh Harvey, yang diperoleh dengan menguji model termasuk Pratinjau Gemini 2.5 Pro melalui API masing-masing, Pratinjau Gemini 2.5 Pro meraih skor tertinggi sebesar 85,02% di BigLaw Bench, mengungguli model lain yang dievaluasi dalam penilaian komprehensif ini.

Teks alternatif: Diagram batang berjudul

Kemampuan terdepan ini sangat penting untuk berbagai aktivitas hukum bernilai tinggi. Tugas evaluasi utama dalam BigLaw Bench menunjukkan keunggulan Pratinjau Gemini 2.5 Pro:

  • Uji tuntas transaksional: Pratinjau Gemini 2.5 Pro menunjukkan kapasitas yang kuat untuk mengekstrak dan meringkas ketentuan penting (misalnya, penetapan, ganti rugi, klausul pengakhiran) dari beberapa perjanjian layanan yang panjang. Hal ini menunjukkan potensi signifikan untuk menyederhanakan proses peninjauan dokumen manual yang memakan waktu.
  • Penyusunan transaksi: Model ini dengan mahir menghasilkan analisis komparatif yang komprehensif dan terstruktur dengan baik untuk opsi keuangan yang rumit (misalnya, PIPE, penawaran ekuitas yang dijamin, penawaran obligasi). Model ini menunjukkan potensi dalam menyajikan informasi ini dengan cara yang jelas dan mudah diakses, bahkan bagi mereka yang tidak memiliki keahlian keuangan mendalam, serta dalam menyarankan item tindakan langsung yang potensial.
  • Pembuatan draf litigasi: Saat dinilai berdasarkan tugas yang terkait dengan litigasi, Gemini 2.5 Pro Preview menunjukkan kemampuan yang luar biasa dalam membuat garis besar yang mendetail untuk dokumen argumen hukum berdasarkan sejumlah besar dokumen ringkasan. Kemampuan ini menunjukkan masa depan di mana AI dapat secara signifikan membantu dalam tahap awal pengembangan dan pengorganisasian argumen hukum.
  • Peninjauan & analisis dokumen: Evaluasi yang melibatkan peninjauan dokumen persidangan yang berbeda-beda (log panggilan, email, memorandum) mengungkapkan keunggulan Gemini 2.5 Pro Preview dalam membuat ringkasan peristiwa kronologis yang koheren. Selain itu, model ini menunjukkan potensi dalam mengidentifikasi inkonsistensi dan ambiguitas penting dalam catatan, yang merupakan aspek penting dari analisis hukum yang menyeluruh.


Dalam evaluasi ini, Gemini 2.5 Pro Preview menunjukkan kemampuan penalaran yang kuat di berbagai input yang terdiri dari ratusan halaman materi, yang merupakan skenario umum dalam pekerjaan hukum. Selain itu, model ini mampu menggunakan materi tersebut untuk menghasilkan output yang lebih panjang dan komprehensif, sehingga memungkinkan insight dan analisis yang lebih mendalam. Kemampuan inti ini menyoroti potensi pemanfaatan Pratinjau Gemini 2.5 Pro dalam pekerjaan hukum yang kompleks yang memerlukan penalaran atas sekumpulan besar dokumen untuk mendukung kasus penggunaan ketelitian, peninjauan, dan penyusunan.

"Di Harvey, kami berkomitmen untuk melengkapi profesional hukum dengan alat tercanggih," kata Niko Grupen, Head of Applied AI di Harvey. "Evaluasi kami terhadap Pratinjau Gemini 2.5 Pro melalui BigLaw Bench telah mengungkapkan kemampuannya yang luar biasa dalam menyintesis informasi hukum yang kompleks. Insight ini mendorong visi kami untuk pengembangan produk di masa mendatang, di mana kami berupaya memanfaatkan keunggulan ini untuk mencapai efisiensi yang belum pernah ada sebelumnya dan memungkinkan pengacara berfokus pada pekerjaan strategis yang lebih penting."

Komitmen Harvey terhadap evaluasi yang ketat dan analisis mendalamnya terhadap model AI canggih seperti Pratinjau Gemini 2.5 Pro menunjukkan potensi transformatif AI di bidang hukum. Temuan mereka membuka jalan bagi inovasi di masa mendatang yang berpotensi mengubah cara para profesional hukum menangani tugas-tugas yang paling menantang.

Untuk mempelajari bagaimana kemampuan penalaran dan sintesis canggih Pratinjau Gemini 2.5 Pro dapat mendukung aplikasi Anda sendiri, buka dokumentasi Gemini API atau mulai di Google AI Studio.

Harvey adalah peserta Dana Masa Depan AI Google yang berinvestasi dan berkolaborasi dengan startup ambisius yang membangun inovasi berikutnya di bidang AI.