۱۶ مه ۲۰۲۵
هاروی: اعتبارسنجی استدلال حقوقی پیشرفته پیشنمایش Gemini 2.5 Pro با BigLaw Bench

هاروی: اعتبارسنجی استدلال حقوقی پیشرفته پیشنمایش Gemini 2.5 Pro با BigLaw Bench
صنعت حقوقی نیازمند راهکارهای هوش مصنوعی است که بتوانند حجم عظیمی از اطلاعات پیچیده را با دقت و ظرافت پیمایش کنند. معیارهای سنتی هوش مصنوعی اغلب در برآوردن نیازهای دنیای واقعیِ رویههای حقوقی ناتوان هستند و این امر، شناسایی مدلهایی را که واقعاً قادر به انجام کارهای حقوقی با ارزش بالا هستند، چالشبرانگیز میکند. هاروی، یک استارتاپ پویا که به تحول گردشهای کاری حقوقی از طریق هوش مصنوعی اختصاص دارد، با توسعه BigLaw Bench، چارچوب جامع خود برای ارزیابی عملکرد مدل زبان بزرگ (LLM) در وظایفی که منعکسکننده کار حقوقی واقعی هستند، با این مشکل روبرو شد. در ارزیابیهای دقیق اخیر آنها، پیشنمایش Gemini 2.5 Pro به عنوان یک عملکرد برجسته ظاهر شد و پتانسیل استثنایی خود را برای بهبود کارایی در حوزههای کلیدی حقوقی نشان داد.
پیشنمایش Gemini 2.5 Pro در صدر نتایج BigLaw قرار گرفت
ارزیابیهای اخیر هاروی با بهرهگیری از چارچوب BigLaw Bench به وضوح نشان داده است که Gemini 2.5 Pro Preview مهارت قابل توجهی را در وظایف اصلی استدلال حقوقی و به ویژه وظایفی که نیاز به استدلال در ورودیها یا خروجیهای حقوقی طولانی دارند، نشان میدهد. همانطور که در نتایج عمومی به اشتراک گذاشته شده توسط هاروی، که با آزمایش مدلهایی از جمله Gemini 2.5 Pro Preview از طریق APIهای مربوطه به دست آمده است، نشان داده شده است، Gemini 2.5 Pro Preview امتیاز پیشرو 85.02٪ را در BigLaw Bench کسب کرد و از سایر مدلهای ارزیابی شده در این ارزیابی جامع پیشی گرفت.

 این قابلیت پیشرو برای طیف گستردهای از فعالیتهای حقوقی با ارزش بالا بسیار مهم است. وظایف ارزیابی کلیدی در BigLaw Bench نقاط قوت پیشنمایش Gemini 2.5 Pro را به نمایش گذاشت:
- بررسی دقیق تراکنشها : پیشنمایش Gemini 2.5 Pro ظرفیت بالایی را برای استخراج و خلاصهسازی مفاد حیاتی (مانند واگذاری، غرامت، بندهای فسخ قرارداد) از چندین قرارداد خدمات طولانی مدت نشان داد. این نشاندهنده پتانسیل قابل توجهی برای سادهسازی فرآیند زمانبر بررسی دستی اسناد است.
- ساختاردهی تراکنشها : این مدل به طور ماهرانهای تحلیلهای مقایسهای جامع و ساختاریافتهای از گزینههای مالی پیچیده (مانند PIPE، عرضه سهام تضمینشده، عرضه اوراق قرضه) ایجاد کرد. این مدل در ارائه این اطلاعات به شیوهای واضح و قابل فهم، حتی برای کسانی که تخصص مالی عمیقی ندارند، و در پیشنهاد موارد اقدام فوری بالقوه، نویدبخش بود.
- تدوین دادخواست : هنگامی که در مورد وظایف مربوط به دعاوی ارزیابی شد، پیشنمایش Gemini 2.5 Pro توانایی قابل توجهی در تولید طرحهای تفصیلی برای خلاصههای حقوقی بر اساس حجم قابل توجهی از اسناد توجیهی نشان داد. این قابلیت به آیندهای اشاره دارد که در آن هوش مصنوعی میتواند به طور قابل توجهی در مراحل اولیه توسعه و سازماندهی استدلالهای حقوقی کمک کند.
- بررسی و تحلیل اسناد : ارزیابیهای مربوط به بررسی اسناد دادرسی پراکنده (گزارشهای تماس، ایمیلها، یادداشتها) قدرت پیشنمایش Gemini 2.5 Pro را در ایجاد خلاصههای زمانی منسجم از رویدادها نشان داد. علاوه بر این، این مدل پتانسیل شناسایی تناقضات و ابهامات مهم در پرونده را نشان داد، که جنبهای حیاتی از تحلیل حقوقی کامل است.
در طول این ارزیابیها، پیشنمایش Gemini 2.5 Pro استدلال قوی را در ورودیهای متشکل از صدها صفحه از مطالب، که یک سناریوی رایج در کارهای حقوقی است، نشان داد. علاوه بر این، قادر به استفاده از این مطالب برای تولید خروجیهای طولانیتر و جامعتر بود که امکان بینشها و تحلیلهای عمیقتر را فراهم میکرد. این قابلیتهای اصلی، پتانسیل استفاده از پیشنمایش Gemini 2.5 Pro را در کارهای حقوقی پیچیده که نیاز به استدلال در مورد مجموعههای بزرگی از اسناد برای پشتیبانی از بررسی، بررسی و تهیه موارد استفاده دارند، برجسته میکند.
استانداردی جدید برای هوش مصنوعی حقوقی
نیکو گروپن، رئیس هوش مصنوعی کاربردی در هاروی، اظهار داشت: «در هاروی، ما متعهد به تجهیز متخصصان حقوقی به پیشرفتهترین ابزارها هستیم. ارزیابی ما از پیشنمایش Gemini 2.5 Pro از طریق BigLaw Bench، توانایی قابل توجه آن را در ترکیب اطلاعات حقوقی پیچیده نشان داده است. این بینش، چشمانداز ما را برای توسعه محصول آینده تقویت میکند، جایی که هدف ما بهرهگیری از این نقاط قوت برای دستیابی به کارایی بیسابقه و توانمندسازی وکلا برای تمرکز بر کارهای استراتژیک سطح بالاتر است.»
گشودن آینده کار حقوقی
 تعهد هاروی به ارزیابی دقیق و تحلیلهای عمیق او از مدلهای پیشرفته هوش مصنوعی مانند Gemini 2.5 Pro Preview، پتانسیل تحولآفرین هوش مصنوعی در حوزه حقوقی را نشان میدهد. یافتههای او راه را برای نوآوریهای آینده هموار میکند که نویدبخش تغییر رویکرد متخصصان حقوقی به دشوارترین وظایفشان است.
 برای بررسی اینکه چگونه قابلیتهای پیشرفته استدلال و ترکیب Gemini 2.5 Pro Preview میتواند برنامههای شما را تقویت کند، از مستندات API Gemini دیدن کنید یا در Google AI Studio شروع به کار کنید.
 هاروی یکی از اعضای صندوق آینده هوش مصنوعی گوگل است که در استارتآپهای بلندپروازی که در حال ساخت آینده هوش مصنوعی هستند، سرمایهگذاری و با آنها همکاری میکند. 
والی
والی از Gemini 2.5 Pro برای سرعت بخشیدن به فرآیند توسعه بازی خود استفاده میکند و ماجراجوییهای سیاهچاله فراگیر با هوش مصنوعی و صدا را با جلوههای بصری Gemini 2.0 Flash و Veo 2 میسازد.


