शेयर करें

16 मई, 2025

Harvey: Validating Gemini 2.5 Pro Preview’s Advanced Legal Reasoning with BigLaw Bench

निको ग्रुपेन

अप्लाइड एआई के हेड

विशाल धर्माधिकारी

AI DevRel

Toonsutra showcase hero

कानूनी क्षेत्र में, एआई के ऐसे समाधानों की ज़रूरत होती है जो जटिल जानकारी को सटीक और बारीकी से समझ सकें. एआई के लिए तय किए गए पारंपरिक बेंचमार्क, अक्सर कानूनी काम से जुड़ी असल दुनिया की ज़रूरतों को पूरा नहीं कर पाते. इसलिए, ऐसे मॉडल की पहचान करना मुश्किल हो जाता है जो कानूनी काम को बेहतर तरीके से कर सकते हैं. Harvey, एक डाइनैमिक स्टार्टअप है. यह एआई की मदद से, कानूनी वर्कफ़्लो को बेहतर बनाने के लिए काम करता है. इसने इस समस्या को हल करने के लिए, BigLaw Bench को डेवलप किया है. यह एक ऐसा फ़्रेमवर्क है जो कानूनी काम से मिलते-जुलते टास्क पर, लार्ज लैंग्वेज मॉडल (एलएलएम) की परफ़ॉर्मेंस का आकलन करता है. हाल ही में किए गए कड़े आकलन में, Gemini 2.5 Pro Preview ने बेहतरीन परफ़ॉर्मेंस दिखाई है. इससे पता चलता है कि यह कानूनी मामलों से जुड़े मुख्य विषयों में, काम को बेहतर तरीके से करने की क्षमता रखता है.

BigLaw Bench पर Gemini 2.5 Pro का प्रीव्यू

हाल ही में, BigLaw Bench फ़्रेमवर्क का इस्तेमाल करके Harvey के आकलन से पता चला है कि Gemini 2.5 Pro Preview, कानूनी तर्क से जुड़े मुख्य टास्क को बहुत अच्छी तरह से पूरा करता है. खास तौर पर, ऐसे टास्क जिनमें लंबे फ़ॉर्म वाले कानूनी इनपुट या आउटपुट के आधार पर तर्क करने की ज़रूरत होती है. सार्वजनिक तौर पर शेयर किए गए हार्वे के नतीजों में दिखाया गया है कि Gemini 2.5 Pro Preview ने BigLaw Bench पर 85.02% का सबसे ज़्यादा स्कोर हासिल किया है. ये नतीजे, Gemini 2.5 Pro Preview के साथ-साथ अन्य मॉडल की टेस्टिंग करके पाए गए हैं. टेस्टिंग के लिए, इन मॉडल के एपीआई का इस्तेमाल किया गया है. इस व्यापक आकलन में, Gemini 2.5 Pro Preview ने अन्य मॉडल से बेहतर परफ़ॉर्म किया है.

वैकल्पिक लेख: बार चार्ट का टाइटल

यह सुविधा, कानूनी तौर पर की जाने वाली कई अहम गतिविधियों के लिए बहुत ज़रूरी है. BigLaw Bench में शामिल मुख्य टास्क के आकलन से, Gemini 2.5 Pro Preview की क्षमताओं का पता चला:

  • लेन-देन से जुड़ी ज़रूरी जांच: Gemini 2.5 Pro Preview में, लंबी अवधि के कई सेवा समझौतों से ज़रूरी प्रावधानों (जैसे, असाइनमेंट, क्षतिपूर्ति, समझौते को खत्म करने से जुड़े क्लॉज़) को निकालने और उनकी खास जानकारी देने की बेहतरीन क्षमता देखी गई. इससे पता चलता है कि मैन्युअल तरीके से दस्तावेज़ की समीक्षा करने में लगने वाले समय को कम किया जा सकता है.
  • लेन-देन का स्ट्रक्चर तैयार करना: मॉडल ने जटिल फ़ाइनेंशियल विकल्पों (जैसे, PIPE, अंडरराइट किए गए इक्विटी ऑफ़र, बॉन्ड ऑफ़र). मॉडल ने इस जानकारी को साफ़ तौर पर और आसानी से समझने लायक तरीके से पेश किया. यह जानकारी उन लोगों के लिए भी आसानी से समझी जा सकती है जिन्हें वित्तीय मामलों की ज़्यादा जानकारी नहीं है. साथ ही, मॉडल ने तुरंत कार्रवाई करने के लिए सुझाव भी दिए.
  • मुकदमे से जुड़े दस्तावेज़ तैयार करना: मुकदमे से जुड़े टास्क के लिए आकलन करने पर, Gemini 2.5 Pro Preview ने कानूनी जानकारी देने वाले दस्तावेज़ों के आधार पर, कानूनी जानकारी देने वाले नोट के लिए ज़्यादा जानकारी वाली आउटलाइन जनरेट करने की बेहतरीन क्षमता दिखाई. इस सुविधा से पता चलता है कि आने वाले समय में, एआई कानूनी तर्क तैयार करने और उन्हें व्यवस्थित करने के शुरुआती चरणों में काफ़ी मदद कर सकता है.
  • दस्तावेज़ की समीक्षा और विश्लेषण: अलग-अलग ट्रायल दस्तावेज़ों (कॉल लॉग, ईमेल, ज्ञापन) की समीक्षा से पता चला कि Gemini 2.5 Pro Preview, घटनाओं के क्रम के हिसाब से सारांश बनाने में बेहतर है. इसके अलावा, मॉडल ने रिकॉर्ड में मौजूद गंभीर विसंगतियों और अस्पष्टताओं की पहचान करने में भी अच्छा प्रदर्शन किया. यह कानूनी विश्लेषण का एक अहम पहलू है.


इन सभी आकलन में, Gemini 2.5 Pro Preview ने तर्क करने की बेहतरीन क्षमता दिखाई. इसमें सैकड़ों पेजों के इनपुट शामिल थे. क़ानूनी काम में ऐसा अक्सर होता है. इसके अलावा, यह इन सामग्रियों का इस्तेमाल करके, ज़्यादा जानकारी वाले और बड़े आउटपुट जनरेट कर सकता था. इससे ज़्यादा अहम जानकारी और विश्लेषण मिल पाते थे. इन मुख्य क्षमताओं से पता चलता है कि Gemini 2.5 Pro Preview का इस्तेमाल, कानूनी मामलों से जुड़े मुश्किल कामों के लिए किया जा सकता है. इसके लिए, कई दस्तावेज़ों को समझने की ज़रूरत होती है, ताकि कानूनी मामलों से जुड़े अलग-अलग कामों को पूरा किया जा सके. जैसे, किसी मामले की बारीकी से जाँच करना, उसकी समीक्षा करना, और उससे जुड़े दस्तावेज़ तैयार करना.

Harvey के हेड ऑफ़ अप्लाइड एआई, निको ग्रुपन कहते हैं,"Harvey में, हम कानूनी पेशेवरों को सबसे आधुनिक टूल उपलब्ध कराने के लिए प्रतिबद्ध हैं." "BigLaw Bench के ज़रिए Gemini 2.5 Pro Preview का आकलन करने पर, हमें पता चला है कि यह मुश्किल कानूनी जानकारी को इकट्ठा करने में काफ़ी बेहतर है. इस अहम जानकारी से, हमें आने वाले समय में प्रॉडक्ट डेवलपमेंट के लिए दिशा मिलती है. हमारा लक्ष्य इन खूबियों का इस्तेमाल करके, अभूतपूर्व दक्षता हासिल करना है. साथ ही, वकीलों को ज़्यादा अहम रणनीतिक काम पर ध्यान देने में मदद करना है."

Harvey, एआई मॉडल का बारीकी से आकलन करने और Gemini 2.5 Pro Preview जैसे बेहतरीन एआई मॉडल का विश्लेषण करने के लिए प्रतिबद्ध है. इससे पता चलता है कि कानूनी क्षेत्र में एआई कितना अहम है. इनकी खोजों से, आने वाले समय में होने वाले इनोवेशन का रास्ता खुलता है. इससे कानूनी पेशेवरों को अपने सबसे मुश्किल कामों को करने का तरीका बदलने में मदद मिलेगी.

Gemini 2.5 Pro Preview की बेहतर रीज़निंग और सिंथेसिस की क्षमताओं के बारे में जानने के लिए, Gemini API का दस्तावेज़ पढ़ें या Google AI Studio में जाकर इसे आज़माएँ.

Harvey, Google के AI Futures Fund में शामिल है. यह फंड, एआई के क्षेत्र में नए-नए प्रयोग करने वाले स्टार्टअप में निवेश करता है और उनके साथ मिलकर काम करता है.