16 พฤษภาคม 2025
Harvey: การยืนยันการให้เหตุผลทางกฎหมายขั้นสูงของ Gemini 2.5 Pro Preview ด้วย BigLaw Bench

Harvey: การยืนยันการให้เหตุผลทางกฎหมายขั้นสูงของ Gemini 2.5 Pro Preview ด้วย BigLaw Bench
อุตสาหกรรมกฎหมายต้องการโซลูชัน AI ที่จัดการข้อมูลจำนวนมากที่ซับซ้อนได้อย่างแม่นยำและละเอียด ดัชนีชี้วัด AI แบบดั้งเดิมมักไม่ครอบคลุมถึงความต้องการในชีวิตจริงของการปฏิบัติทางกฎหมาย ทำให้การระบุโมเดลที่ทำงานด้านกฎหมายที่มีมูลค่าสูงได้อย่างแท้จริงเป็นเรื่องยาก Harvey ซึ่งเป็นสตาร์ทอัพที่มุ่งมั่นที่จะเปลี่ยนรูปแบบเวิร์กโฟลว์ทางกฎหมายผ่าน AI ได้แก้ปัญหานี้ด้วยการพัฒนา BigLaw Bench ซึ่งเป็นเฟรมเวิร์กแบบครอบคลุมสำหรับประเมินประสิทธิภาพของโมเดลภาษาขนาดใหญ่ (LLM) ในงานที่จำลองงานทางกฎหมายจริง จากการประเมินที่เข้มงวดครั้งล่าสุด Gemini 2.5 Pro Preview มีประสิทธิภาพโดดเด่นและแสดงให้เห็นถึงศักยภาพที่ยอดเยี่ยมในการปรับปรุงประสิทธิภาพในโดเมนทางกฎหมายที่สำคัญ
Gemini 2.5 Pro (เวอร์ชันตัวอย่าง) ครองอันดับสูงสุดใน BigLaw Bench
การประเมินล่าสุดของ Harvey โดยใช้เฟรมเวิร์ก BigLaw Bench แสดงให้เห็นอย่างชัดเจนว่าเวอร์ชันตัวอย่างของ Gemini 2.5 Pro แสดงให้เห็นถึงความเชี่ยวชาญที่น่าทึ่งในงานการให้เหตุผลทางกฎหมายหลักๆ และโดยเฉพาะอย่างยิ่งงานที่ต้องอาศัยการให้เหตุผลเกี่ยวกับอินพุตหรือเอาต์พุตทางกฎหมายแบบยาว ดังที่แสดงในผลการทดสอบที่ Harvey แชร์ต่อสาธารณะ ซึ่งได้จากการทดสอบโมเดลต่างๆ รวมถึง Gemini 2.5 Pro Preview ผ่าน API ที่เกี่ยวข้อง Gemini 2.5 Pro Preview ได้คะแนนสูงสุด 85.02% ใน BigLaw Bench ซึ่งสูงกว่าโมเดลอื่นๆ ที่ประเมินในการประเมินที่ครอบคลุมนี้

ความสามารถชั้นนำนี้มีความสำคัญอย่างยิ่งต่อกิจกรรมทางกฎหมายที่มีมูลค่าสูงหลากหลายประเภท งานประเมินที่สำคัญภายใน BigLaw Bench แสดงให้เห็นถึงจุดแข็งของ Gemini 2.5 Pro เวอร์ชันตัวอย่าง ดังนี้
- ความระมัดระวังในเชิงพาณิชย์: Gemini 2.5 Pro Preview แสดงให้เห็นถึงความสามารถในการดึงข้อมูลและสรุปบทบัญญัติที่สำคัญ (เช่น การเปลี่ยน ภาระชดเชย ข้อกำหนดการสิ้นสุด) จากข้อตกลงในการให้บริการที่ยาวหลายฉบับ ซึ่งแสดงให้เห็นถึงศักยภาพที่สำคัญในการปรับปรุงกระบวนการตรวจสอบเอกสารด้วยตนเองที่ใช้เวลานาน
- การจัดโครงสร้างธุรกรรม: โมเดลสร้างการวิเคราะห์เปรียบเทียบที่ครอบคลุมและมีโครงสร้างดีเยี่ยมเกี่ยวกับตัวเลือกทางการเงินที่ซับซ้อน (เช่น PIPE, การเสนอขายหุ้นที่มีการรับประกัน การเสนอขายพันธบัตร) โมเดลนี้แสดงให้เห็นถึงแนวโน้มในการนำเสนอข้อมูลนี้ในลักษณะที่ชัดเจนและเข้าถึงได้ แม้สำหรับผู้ที่ไม่มีความเชี่ยวชาญทางการเงินมากนัก และในการแนะนำรายการการดำเนินการที่อาจทำได้ทันที
- การร่างเอกสารฟ้องร้อง: เมื่อประเมินงานที่เกี่ยวข้องกับการฟ้องร้อง Gemini 2.5 Pro Preview แสดงความสามารถในการสร้างเค้าโครงรายละเอียดสำหรับข้อมูลสรุปทางกฎหมายโดยอิงตามเอกสารข้อมูลสรุปจำนวนมาก ความสามารถนี้ชี้ให้เห็นถึงอนาคตที่ AI จะช่วยได้มากในขั้นตอนแรกของการพัฒนาและการจัดระเบียบการโต้แย้งทางกฎหมาย
- การตรวจสอบและวิเคราะห์เอกสาร: การประเมินที่เกี่ยวข้องกับการตรวจสอบเอกสารการทดลองที่แตกต่างกัน (บันทึกการโทร อีเมล บันทึกช่วยจำ) แสดงให้เห็นถึงจุดแข็งของ Gemini 2.5 Pro Preview ในการสร้างสรุปเหตุการณ์ตามลำดับเวลาที่สอดคล้องกัน นอกจากนี้ โมเดลนี้ยังแสดงให้เห็นถึงศักยภาพในการระบุความไม่สอดคล้องและความคลุมเครือที่สำคัญในบันทึก ซึ่งเป็นแง่มุมสําคัญของการวิเคราะห์ทางกฎหมายที่ละเอียด
ในการทดสอบเหล่านี้ Gemini 2.5 Pro Preview แสดงให้เห็นถึงเหตุผลที่ชัดเจนในอินพุตที่ประกอบด้วยเนื้อหาหลายร้อยหน้า ซึ่งเป็นสถานการณ์ที่พบได้ทั่วไปในกระบวนการทางกฎหมาย นอกจากนี้ ยังสามารถนําเนื้อหาเหล่านี้มาใช้สร้างเอาต์พุตแบบยาวที่ครอบคลุมได้ ซึ่งช่วยให้ได้ข้อมูลเชิงลึกและการวิเคราะห์ที่ละเอียดยิ่งขึ้น ความสามารถหลักเหล่านี้แสดงให้เห็นถึงศักยภาพในการใช้ประโยชน์จาก Gemini 2.5 Pro Preview ในงานกฎหมายที่ซับซ้อนซึ่งต้องใช้เหตุผลกับชุดเอกสารขนาดใหญ่เพื่อสนับสนุนความรอบคอบ การตรวจสอบ และการร่างกรณีการใช้งาน
มาตรฐานใหม่สำหรับ AI ทางกฎหมาย
"ที่ Harvey เรามุ่งมั่นที่จะมอบเครื่องมือที่ทันสมัยที่สุดให้แก่ผู้เชี่ยวชาญด้านกฎหมาย" Niko Grupen หัวหน้าทีม AI ประยุกต์ใช้ของ Harvey กล่าว "การประเมิน Gemini 2.5 Pro Preview ผ่าน BigLaw Bench แสดงให้เห็นถึงความสามารถอันน่าทึ่งในการสังเคราะห์ข้อมูลทางกฎหมายที่ซับซ้อน ข้อมูลเชิงลึกนี้ช่วยขับเคลื่อนวิสัยทัศน์ของเราในการพัฒนาผลิตภัณฑ์ในอนาคต ซึ่งเรามุ่งเน้นที่จะใช้ประโยชน์จากจุดแข็งเหล่านี้เพื่อปลดล็อกประสิทธิภาพที่ไม่เคยมีมาก่อนและช่วยให้ทนายความสามารถมุ่งเน้นที่งานเชิงกลยุทธ์ในระดับที่สูงขึ้น"
ปลดล็อกอนาคตของงานด้านกฎหมาย
ความมุ่งมั่นของ Harvey ในการประเมินอย่างเข้มงวดและการวิเคราะห์เชิงลึกเกี่ยวกับโมเดล AI อันล้ำสมัยอย่าง Gemini 2.5 Pro Preview แสดงให้เห็นถึงศักยภาพในการพลิกโฉมวงการกฎหมายของ AI ผลการวิจัยนี้ปูทางไปสู่นวัตกรรมในอนาคตที่จะเปลี่ยนวิธีการทำงานของผู้เชี่ยวชาญด้านกฎหมายในการจัดการงานที่ท้าทายที่สุด
หากต้องการดูว่าความสามารถในการใช้เหตุผลและการสังเคราะห์ขั้นสูงของ Gemini 2.5 Pro Preview จะช่วยเพิ่มประสิทธิภาพแอปพลิเคชันของคุณได้อย่างไร โปรดไปที่เอกสารประกอบของ Gemini API หรือเริ่มต้นใช้งานใน Google AI Studio
Harvey เป็นผู้เข้าร่วมในกองทุนเพื่ออนาคตด้าน AI ของ Google ซึ่งลงทุนและทำงานร่วมกับสตาร์ทอัพที่มีความทะเยอทะยานในการสร้างเทคโนโลยี AI ใหม่ๆ