اشتراک گذاری

۱۶ مه ۲۰۲۵

هاروی: اعتبارسنجی استدلال حقوقی پیشرفته پیش‌نمایش Gemini 2.5 Pro با BigLaw Bench

نیکو گروپن

رئیس هوش مصنوعی کاربردی

ویشال دارمادیکاری

توسعه‌دهنده هوش مصنوعی

قهرمان ویترینی تونسوترا

صنعت حقوقی نیازمند راهکارهای هوش مصنوعی است که بتوانند حجم عظیمی از اطلاعات پیچیده را با دقت و ظرافت پیمایش کنند. معیارهای سنتی هوش مصنوعی اغلب در برآوردن نیازهای دنیای واقعیِ رویه‌های حقوقی ناتوان هستند و این امر، شناسایی مدل‌هایی را که واقعاً قادر به انجام کارهای حقوقی با ارزش بالا هستند، چالش‌برانگیز می‌کند. هاروی، یک استارتاپ پویا که به تحول گردش‌های کاری حقوقی از طریق هوش مصنوعی اختصاص دارد، با توسعه BigLaw Bench، چارچوب جامع خود برای ارزیابی عملکرد مدل زبان بزرگ (LLM) در وظایفی که منعکس‌کننده کار حقوقی واقعی هستند، با این مشکل روبرو شد. در ارزیابی‌های دقیق اخیر آنها، پیش‌نمایش Gemini 2.5 Pro به عنوان یک عملکرد برجسته ظاهر شد و پتانسیل استثنایی خود را برای بهبود کارایی در حوزه‌های کلیدی حقوقی نشان داد.

پیش‌نمایش Gemini 2.5 Pro در صدر نتایج BigLaw قرار گرفت

ارزیابی‌های اخیر هاروی با بهره‌گیری از چارچوب BigLaw Bench به وضوح نشان داده است که Gemini 2.5 Pro Preview مهارت قابل توجهی را در وظایف اصلی استدلال حقوقی و به ویژه وظایفی که نیاز به استدلال در ورودی‌ها یا خروجی‌های حقوقی طولانی دارند، نشان می‌دهد. همانطور که در نتایج عمومی به اشتراک گذاشته شده توسط هاروی، که با آزمایش مدل‌هایی از جمله Gemini 2.5 Pro Preview از طریق APIهای مربوطه به دست آمده است، نشان داده شده است، Gemini 2.5 Pro Preview امتیاز پیشرو 85.02٪ را در BigLaw Bench کسب کرد و از سایر مدل‌های ارزیابی شده در این ارزیابی جامع پیشی گرفت.

متن جایگزین: نمودار میله‌ای با عنوان

این قابلیت پیشرو برای طیف گسترده‌ای از فعالیت‌های حقوقی با ارزش بالا بسیار مهم است. وظایف ارزیابی کلیدی در BigLaw Bench نقاط قوت پیش‌نمایش Gemini 2.5 Pro را به نمایش گذاشت:

  • بررسی دقیق تراکنش‌ها : پیش‌نمایش Gemini 2.5 Pro ظرفیت بالایی را برای استخراج و خلاصه‌سازی مفاد حیاتی (مانند واگذاری، غرامت، بندهای فسخ قرارداد) از چندین قرارداد خدمات طولانی مدت نشان داد. این نشان‌دهنده پتانسیل قابل توجهی برای ساده‌سازی فرآیند زمان‌بر بررسی دستی اسناد است.
  • ساختاردهی تراکنش‌ها : این مدل به طور ماهرانه‌ای تحلیل‌های مقایسه‌ای جامع و ساختاریافته‌ای از گزینه‌های مالی پیچیده (مانند PIPE، عرضه سهام تضمین‌شده، عرضه اوراق قرضه) ایجاد کرد. این مدل در ارائه این اطلاعات به شیوه‌ای واضح و قابل فهم، حتی برای کسانی که تخصص مالی عمیقی ندارند، و در پیشنهاد موارد اقدام فوری بالقوه، نویدبخش بود.
  • تدوین دادخواست : هنگامی که در مورد وظایف مربوط به دعاوی ارزیابی شد، پیش‌نمایش Gemini 2.5 Pro توانایی قابل توجهی در تولید طرح‌های تفصیلی برای خلاصه‌های حقوقی بر اساس حجم قابل توجهی از اسناد توجیهی نشان داد. این قابلیت به آینده‌ای اشاره دارد که در آن هوش مصنوعی می‌تواند به طور قابل توجهی در مراحل اولیه توسعه و سازماندهی استدلال‌های حقوقی کمک کند.
  • بررسی و تحلیل اسناد : ارزیابی‌های مربوط به بررسی اسناد دادرسی پراکنده (گزارش‌های تماس، ایمیل‌ها، یادداشت‌ها) قدرت پیش‌نمایش Gemini 2.5 Pro را در ایجاد خلاصه‌های زمانی منسجم از رویدادها نشان داد. علاوه بر این، این مدل پتانسیل شناسایی تناقضات و ابهامات مهم در پرونده را نشان داد، که جنبه‌ای حیاتی از تحلیل حقوقی کامل است.


در طول این ارزیابی‌ها، پیش‌نمایش Gemini 2.5 Pro استدلال قوی را در ورودی‌های متشکل از صدها صفحه از مطالب، که یک سناریوی رایج در کارهای حقوقی است، نشان داد. علاوه بر این، قادر به استفاده از این مطالب برای تولید خروجی‌های طولانی‌تر و جامع‌تر بود که امکان بینش‌ها و تحلیل‌های عمیق‌تر را فراهم می‌کرد. این قابلیت‌های اصلی، پتانسیل استفاده از پیش‌نمایش Gemini 2.5 Pro را در کارهای حقوقی پیچیده که نیاز به استدلال در مورد مجموعه‌های بزرگی از اسناد برای پشتیبانی از بررسی، بررسی و تهیه موارد استفاده دارند، برجسته می‌کند.

نیکو گروپن، رئیس هوش مصنوعی کاربردی در هاروی، اظهار داشت: «در هاروی، ما متعهد به تجهیز متخصصان حقوقی به پیشرفته‌ترین ابزارها هستیم. ارزیابی ما از پیش‌نمایش Gemini 2.5 Pro از طریق BigLaw Bench، توانایی قابل توجه آن را در ترکیب اطلاعات حقوقی پیچیده نشان داده است. این بینش، چشم‌انداز ما را برای توسعه محصول آینده تقویت می‌کند، جایی که هدف ما بهره‌گیری از این نقاط قوت برای دستیابی به کارایی بی‌سابقه و توانمندسازی وکلا برای تمرکز بر کارهای استراتژیک سطح بالاتر است.»

تعهد هاروی به ارزیابی دقیق و تحلیل‌های عمیق او از مدل‌های پیشرفته هوش مصنوعی مانند Gemini 2.5 Pro Preview، پتانسیل تحول‌آفرین هوش مصنوعی در حوزه حقوقی را نشان می‌دهد. یافته‌های او راه را برای نوآوری‌های آینده هموار می‌کند که نویدبخش تغییر رویکرد متخصصان حقوقی به دشوارترین وظایفشان است.

برای بررسی اینکه چگونه قابلیت‌های پیشرفته استدلال و ترکیب Gemini 2.5 Pro Preview می‌تواند برنامه‌های شما را تقویت کند، از مستندات API Gemini دیدن کنید یا در Google AI Studio شروع به کار کنید.

هاروی یکی از اعضای صندوق آینده هوش مصنوعی گوگل است که در استارت‌آپ‌های بلندپروازی که در حال ساخت آینده هوش مصنوعی هستند، سرمایه‌گذاری و با آنها همکاری می‌کند.

والی

والی از Gemini 2.5 Pro برای سرعت بخشیدن به فرآیند توسعه بازی خود استفاده می‌کند و ماجراجویی‌های سیاه‌چاله فراگیر با هوش مصنوعی و صدا را با جلوه‌های بصری Gemini 2.0 Flash و Veo 2 می‌سازد.