Harvey: التحقّق من صحة ميزة "الاستدلال القانوني المتقدّم" في الإصدار التجريبي من Gemini 2.5 Pro باستخدام مقياس BigLaw
نيكو غروبن
رئيس قسم الذكاء الاصطناعي التطبيقي
فيشال دارماديكاري
AI DevRel
Harvey: التحقّق من صحة ميزة "الاستدلال القانوني المتقدّم" في الإصدار التجريبي من Gemini 2.5 Pro باستخدام مقياس BigLaw
يتطلّب المجال القانوني حلولاً مستندة إلى الذكاء الاصطناعي يمكنها التعامل مع كمية هائلة من المعلومات المعقّدة بدقة وفهم دقيق. غالبًا ما لا تستوفي مقاييس الأداء التقليدية للذكاء الاصطناعي متطلبات الممارسة القانونية في الواقع، ما يجعل من الصعب تحديد النماذج القادرة حقًا على أداء أعمال قانونية عالية القيمة. واجهت شركة Harvey الناشئة والديناميكية، التي تهدف إلى تغيير عمليات سير العمل القانونية من خلال الذكاء الاصطناعي، هذا التحدي من خلال تطوير BigLaw Bench، وهو إطار عمل شامل لتقييم أداء النماذج اللغوية الكبيرة (LLM) في المهام التي تحاكي العمل القانوني الفعلي. في التقييمات الصارمة الأخيرة، برزت "معاينة Gemini 2.5 Pro" كأداة فائقة الأداء، ما يدل على إمكاناتها الاستثنائية في تحسين الكفاءة في المجالات القانونية الرئيسية.
النسخة الحصرية من Gemini 2.5 Pro تتفوّق على معيار BigLaw
أوضحت التقييمات الأخيرة التي أجرتها Harvey باستخدام إطار عمل BigLaw Bench أنّ "النسخة الحصرية من Gemini 2.5 Pro" تُظهر كفاءة ملحوظة في مهام الاستدلال القانوني الأساسية، وخاصةً المهام التي تتطلّب الاستدلال على مدخلات أو مخرجات قانونية طويلة. كما هو موضّح في النتائج التي شاركتها شركة Harvey علنًا، والتي تم الحصول عليها من خلال اختبار نماذج، بما في ذلك الإصدار التجريبي من Gemini 2.5 Pro، عبر واجهات برمجة التطبيقات الخاصة بها، حقّق الإصدار التجريبي من Gemini 2.5 Pro أعلى نتيجة بلغت% 85.02 في BigLaw Bench، متفوّقًا على النماذج الأخرى التي تم تقييمها في هذا التقييم الشامل.
هذه الإمكانية الرائدة ضرورية لمجموعة كبيرة من الأنشطة القانونية القيّمة. عرضت مهام التقييم الرئيسية ضمن BigLaw Bench نقاط قوة "النسخة الحصرية من Gemini 2.5 Pro":
التدقيق المالي في المعاملات: أظهرت معاينة Gemini 2.5 Pro قدرة عالية على استخراج وتلخيص البنود المهمة (مثل بنود التنازل والتعويض والإنهاء) من اتفاقيات خدمة متعددة وطويلة. يشير ذلك إلى إمكانية كبيرة لتبسيط عملية المراجعة اليدوية للمستندات التي تستغرق وقتًا طويلاً.
تنظيم المعاملات: أنشأ النموذج ببراعة تحليلات مقارنة شاملة ومنظَّمة بشكل جيد للخيارات المالية المعقّدة (مثل PIPE، وعروض الأسهم المكتتبة، وعروض السندات). وقد أظهر النموذج نتائج واعدة في تقديم هذه المعلومات بطريقة واضحة وسهلة الوصول إليها، حتى بالنسبة إلى الأشخاص الذين لا يملكون خبرة مالية كبيرة، وفي اقتراح إجراءات فورية محتملة.
صياغة الدعاوى القضائية: عند تقييم Gemini 2.5 Pro Preview في مهام متعلقة بالدعاوى القضائية، أظهر قدرة ملحوظة على إنشاء مخططات تفصيلية للمذكرات القانونية استنادًا إلى كميات كبيرة من مستندات الإحاطة. تشير هذه الإمكانية إلى مستقبل يمكن فيه للذكاء الاصطناعي أن يساعد بشكل كبير في المراحل الأولية من تطوير الحجج القانونية وتنظيمها.
مراجعة المستندات وتحليلها: كشفت التقييمات التي تتضمّن مراجعة مستندات تجريبية مختلفة (سجلات المكالمات ورسائل البريد الإلكتروني والمذكرات) عن قدرة "معاينة Gemini 2.5 Pro" على إنشاء ملخّصات زمنية متماسكة للأحداث. علاوةً على ذلك، أظهر النموذج إمكانية تحديد التناقضات والغموض المهم في السجلّ، وهو جانب بالغ الأهمية في التحليل القانوني الشامل.
في عمليات التقييم هذه، أظهرت معاينة Gemini 2.5 Pro قدرات استدلال قوية في ما يتعلّق بالمدخلات التي تتألف من مئات الصفحات من المواد، وهو سيناريو شائع في العمل القانوني. بالإضافة إلى ذلك، كان بإمكانه استخدام هذه المواد لإنشاء نواتج أطول وأكثر شمولاً، ما يتيح الحصول على إحصاءات وتحليلات أكثر تفصيلاً. تسلّط هذه الإمكانات الأساسية الضوء على إمكانية الاستفادة من إصدار Gemini 2.5 Pro التجريبي في الأعمال القانونية المعقّدة التي تتطلّب الاستدلال على مجموعات كبيرة من المستندات لدعم حالات استخدام التدقيق والمراجعة والصياغة.
معيار جديد للذكاء الاصطناعي القانوني
يقول نيكو غروبن، رئيس قسم الذكاء الاصطناعي التطبيقي في Harvey: "نحن ملتزمون في Harvey بتزويد المتخصصين في القانون بأكثر الأدوات تقدّمًا". "أظهرت نتائج تقييمنا لإصدار Gemini 2.5 Pro Preview من خلال BigLaw Bench قدرته المذهلة على تجميع المعلومات القانونية المعقّدة. تساعدنا هذه الإحصاءات في تحقيق رؤيتنا لتطوير المنتجات المستقبلية، حيث نهدف إلى الاستفادة من نقاط القوة هذه لتحقيق كفاءة غير مسبوقة وتمكين المحامين من التركيز على العمل الاستراتيجي الأهم".
استكشاف مستقبل العمل القانوني
يؤكّد التزام Harvey بالتقييم الدقيق والتحليل الثاقب لنماذج الذكاء الاصطناعي المتطورة، مثل الإصدار التجريبي من Gemini 2.5 Pro، على الإمكانات التحويلية للذكاء الاصطناعي في المجال القانوني. تمهّد النتائج التي توصّلوا إليها الطريق أمام ابتكارات مستقبلية من شأنها إعادة تشكيل الطريقة التي يتعامل بها المحامون مع مهامهم الأكثر تطلّبًا.
للتعرّف على كيفية الاستفادة من إمكانات الاستدلال والتوليف المتقدّمة في إصدار Gemini 2.5 Pro Preview في تطبيقاتك، يمكنك الاطّلاع على مستندات Gemini API أو البدء في Google AI Studio.
[[["يسهُل فهم المحتوى.","easyToUnderstand","thumb-up"],["ساعَدني المحتوى في حلّ مشكلتي.","solvedMyProblem","thumb-up"],["غير ذلك","otherUp","thumb-up"]],[["لا يحتوي على المعلومات التي أحتاج إليها.","missingTheInformationINeed","thumb-down"],["الخطوات معقدة للغاية / كثيرة جدًا.","tooComplicatedTooManySteps","thumb-down"],["المحتوى قديم.","outOfDate","thumb-down"],["ثمة مشكلة في الترجمة.","translationIssue","thumb-down"],["مشكلة في العيّنات / التعليمات البرمجية","samplesCodeIssue","thumb-down"],["غير ذلك","otherDown","thumb-down"]],[],[],[],null,["[](/showcase) \nShare\nMay 16, 2025 \n\nHarvey: Validating Gemini 2.5 Pro Preview's Advanced Legal Reasoning with BigLaw Bench \nNiko Grupen\n\nHead of Applied AI \nVishal Dharmadhikari\n\nAI DevRel \n\nHarvey: Validating Gemini 2.5 Pro Preview's Advanced Legal Reasoning with BigLaw Bench \n\nThe legal industry demands AI solutions that can navigate an immense volume of complex information with precision and nuance. Traditional AI benchmarks often fall short of capturing the real-world demands of legal practice, making it challenging to identify models truly capable of high-value legal work. Harvey, a dynamic startup dedicated to transforming legal workflows through AI, confronted this by developing BigLaw Bench, their comprehensive framework for assessing Large Language Model (LLM) performance on tasks mirroring actual legal work. In their recent rigorous evaluations, Gemini 2.5 Pro Preview emerged as a standout performer, demonstrating exceptional potential to improve efficiency in key legal domains.\n\nGemini 2.5 Pro Preview Leads on BigLaw Bench \n\nHarvey's recent evaluations leveraging the BigLaw Bench framework have clearly indicated that Gemini 2.5 Pro Preview demonstrates remarkable proficiency across core legal reasoning tasks and, in particular, tasks requiring reasoning over long-form legal inputs or outputs. As shown in Harvey's publicly shared results, obtained by testing models including Gemini 2.5 Pro Preview via their respective APIs, Gemini 2.5 Pro Previewachieved the leading score of 85.02% on BigLaw Bench, outperforming other models evaluated in this comprehensive assessment.\n\nThis leading capability is crucial for a wide range of high-value legal activities. Key evaluation tasks within BigLaw Bench showcased Gemini 2.5 Pro Preview's strengths:\n\n\n\u003cbr /\u003e\n\n\n- **Transactional due diligence**: Gemini 2.5 Pro Preview showed a strong capacity to extract and summarize critical provisions (e.g., assignment, indemnification, termination clauses) from multiple lengthy service agreements. This suggests a significant potential to streamline the time-intensive process of manual document review.\n- **Transaction structuring**: The model adeptly generated comprehensive, well-structured comparative analyses of intricate financial options (e.g., PIPE, underwritten equity offerings, bond offerings). The model showed promise in presenting this information in a clear and accessible manner, even for those without deep financial expertise, and in suggesting potential immediate action items.\n- **Litigation drafting**: When assessed on tasks related to litigation, Gemini 2.5 Pro Preview exhibited a notable ability to generate detailed outlines for legal briefs based on substantial volumes of briefing documents. This capability points towards a future where AI can significantly aid in the initial stages of legal argument development and organization.\n- **Document review \\& analysis**: Evaluations involving the review of disparate trial documents (call logs, emails, memoranda) revealed Gemini 2.5 Pro Preview's strength in creating coherent chronological summaries of events. Furthermore, the model showed potential in identifying critical inconsistencies and ambiguities within the record, a crucial aspect of thorough legal analysis.\n\n\u003cbr /\u003e\n\n\u003cbr /\u003e\n\nAcross these evaluations, Gemini 2.5 Pro Preview showcased strong reasoning across inputs consisting of hundreds of pages of materials, a common scenario in legal work. In addition, it was capable of using these materials to generate longer-form and comprehensive outputs, allowing for deeper insights and analyses. These core capabilities highlight the potential for leveraging Gemini 2.5 Pro Preview across complex legal work requiring reasoning over large sets of documents to support diligence, review, and drafting use cases.\n\n\u003cbr /\u003e\n\nA New Standard for Legal AI \n\n\"At Harvey, we're committed to equipping legal professionals with the most advanced tools,\" states Niko Grupen, Head of Applied AI at Harvey. \"Our evaluation of Gemini 2.5 Pro Preview through BigLaw Bench has revealed its remarkable ability to synthesize complex legal information. This insight fuels our vision for future product development, where we aim to leverage these strengths to unlock unprecedented efficiency and empower lawyers to focus on higher-level strategic work.\"\n\nUnlocking the Future of Legal Work \n\nHarvey's commitment to rigorous evaluation and their insightful analysis of cutting-edge AI models like Gemini 2.5 Pro Preview are demonstrating the transformative potential of AI in the legal field. Their findings pave the way for future innovations that promise to reshape how legal professionals approach their most demanding tasks.\n\n\n\u003cbr /\u003e\n\n\nTo explore how Gemini 2.5 Pro Preview's advanced reasoning and synthesis capabilities can power your own applications, visit the [Gemini API documentation](https://ai.google.dev/gemini-api/docs) or get started in [Google AI Studio](https://ai.dev).\n\n\n\u003cbr /\u003e\n\n\nHarvey is a participant in [Google's AI Futures Fund](https://labs.google/aifuturesfund) that invests in and collaborates with ambitious startups building what's next in AI. \n\nRelated case studies \n[Synthesia\nSynthesia uses Veo 2 to create studio quality AI avatar experiences.](/showcase/synthesia) [Toonsutra 2\nToonsutra uses Gemini 2.5 Pro Preview to power an immersive comic reading experience with adaptive AI narration, dynamic soundscapes, and enhanced interactivity.](/showcase/toonsutra-2) [Volley\nVolley uses Gemini 2.5 Pro to accelerate its game development process, building immersive voice-AI dungeon adventures with visuals from Gemini 2.0 Flash and Veo 2.](/showcase/volley-2)"]]