Harvey: การตรวจสอบการให้เหตุผลทางกฎหมายขั้นสูงของ Gemini 2.5 Pro เวอร์ชันตัวอย่างด้วย BigLaw Bench

Niko Grupen

หัวหน้าฝ่าย AI ที่นำไปใช้

Vishal Dharmadhikari

AI DevRel

Harvey: การตรวจสอบการให้เหตุผลทางกฎหมายขั้นสูงของ Gemini 2.5 Pro เวอร์ชันตัวอย่างด้วย BigLaw Bench

อุตสาหกรรมกฎหมายต้องการโซลูชัน AI ที่สามารถจัดการข้อมูลที่ซับซ้อนจำนวนมหาศาลได้อย่างแม่นยำและละเอียด การเปรียบเทียบ AI แบบเดิมมักไม่สามารถตอบสนองความต้องการในโลกแห่งความเป็นจริงของการประกอบวิชาชีพกฎหมายได้ ทำให้การระบุโมเดลที่มีความสามารถในการทำงานด้านกฎหมายที่มีมูลค่าสูงอย่างแท้จริงเป็นเรื่องยาก Harvey สตาร์ทอัพแบบไดนามิกที่มุ่งมั่นที่จะเปลี่ยนเวิร์กโฟลว์ทางกฎหมายผ่าน AI ได้รับมือกับปัญหานี้ด้วยการพัฒนา BigLaw Bench ซึ่งเป็นเฟรมเวิร์กที่ครอบคลุมสำหรับการประเมินประสิทธิภาพของโมเดลภาษาขนาดใหญ่ (LLM) ในงานที่จำลองงานทางกฎหมายจริง ในการประเมินอย่างเข้มงวดล่าสุด Gemini 2.5 Pro เวอร์ชันตัวอย่างได้กลายเป็นโมเดลที่มีประสิทธิภาพโดดเด่น ซึ่งแสดงให้เห็นถึงศักยภาพที่ยอดเยี่ยมในการปรับปรุงประสิทธิภาพในโดเมนกฎหมายที่สำคัญ

เวอร์ชันตัวอย่างของ Gemini 2.5 Pro ได้รับการนำไปใช้ใน BigLaw Bench

การประเมินล่าสุดของ Harvey โดยใช้ประโยชน์จากกรอบ BigLaw Bench แสดงให้เห็นอย่างชัดเจนว่า Gemini 2.5 Pro เวอร์ชันตัวอย่างมีความเชี่ยวชาญที่โดดเด่นในงานการให้เหตุผลทางกฎหมายหลักๆ และโดยเฉพาะอย่างยิ่ง งานที่ต้องใช้การให้เหตุผลเกี่ยวกับอินพุตหรือเอาต์พุตทางกฎหมายแบบยาว ดังที่แสดงในผลลัพธ์ที่ Harvey แชร์ต่อสาธารณะ ซึ่งได้จากการทดสอบโมเดลต่างๆ รวมถึง Gemini 2.5 Pro เวอร์ชันตัวอย่างผ่าน API ที่เกี่ยวข้อง Gemini 2.5 Pro เวอร์ชันตัวอย่างทำคะแนนได้สูงสุดที่ 85.02% ใน BigLaw Bench ซึ่งเหนือกว่าโมเดลอื่นๆ ที่ได้รับการประเมินในการประเมินที่ครอบคลุมนี้

ความสามารถชั้นนำนี้มีความสำคัญอย่างยิ่งต่อกิจกรรมทางกฎหมายที่มีมูลค่าสูงหลากหลายประเภท งานประเมินที่สำคัญภายใน BigLaw Bench แสดงให้เห็นถึงจุดแข็งของ Gemini 2.5 Pro เวอร์ชันตัวอย่าง ดังนี้

การตรวจสอบวิเคราะห์เนื่องจากธุรกรรม: ตัวอย่าง Gemini 2.5 Pro แสดงให้เห็นถึงความสามารถที่แข็งแกร่งในการดึงและสรุปข้อกำหนดที่สำคัญ (เช่น ข้อกำหนดในการมอบหมาย การชดเชย ข้อกำหนดในการสิ้นสุด) จากข้อตกลงในการให้บริการที่ยาวหลายฉบับ ซึ่งแสดงให้เห็นถึงศักยภาพที่สำคัญในการปรับปรุงกระบวนการตรวจสอบเอกสารด้วยตนเองที่ใช้เวลานาน
การจัดโครงสร้างธุรกรรม: โมเดลนี้สร้างการวิเคราะห์เปรียบเทียบที่ครอบคลุมและมีโครงสร้างที่ดีเกี่ยวกับตัวเลือกทางการเงินที่ซับซ้อนได้อย่างเชี่ยวชาญ (เช่น PIPE, การเสนอขายหุ้นที่รับประกัน การเสนอขายพันธบัตร) โมเดลนี้แสดงให้เห็นถึงศักยภาพในการนำเสนอข้อมูลนี้ในลักษณะที่ชัดเจนและเข้าถึงได้ แม้แต่สำหรับผู้ที่ไม่มีความเชี่ยวชาญด้านการเงินอย่างลึกซึ้ง และในการแนะนำรายการการดำเนินการที่อาจเกิดขึ้นในทันที
การร่างการดำเนินคดี: เมื่อได้รับการประเมินในงานที่เกี่ยวข้องกับการดำเนินคดี Gemini 2.5 Pro เวอร์ชันตัวอย่างแสดงให้เห็นความสามารถที่โดดเด่นในการสร้างโครงร่างโดยละเอียดสำหรับคำชี้แจงทางกฎหมายโดยอิงตามเอกสารสรุปจำนวนมาก ความสามารถนี้ชี้ให้เห็นถึงอนาคตที่ AI จะช่วยได้อย่างมากในระยะเริ่มต้นของการพัฒนาและการจัดระเบียบข้อโต้แย้งทางกฎหมาย
การตรวจสอบและวิเคราะห์เอกสาร: การประเมินที่เกี่ยวข้องกับการตรวจสอบเอกสารการพิจารณาคดีที่แตกต่างกัน (บันทึกการโทร อีเมล บันทึกช่วยจำ) แสดงให้เห็นถึงความสามารถของ Gemini 2.5 Pro เวอร์ชันตัวอย่างในการสร้างข้อมูลสรุปเหตุการณ์ตามลำดับเวลาที่สอดคล้องกัน นอกจากนี้ โมเดลยังแสดงให้เห็นถึงศักยภาพในการระบุความไม่สอดคล้องและความคลุมเครือที่สำคัญภายในบันทึก ซึ่งเป็นแง่มุมที่สำคัญของการวิเคราะห์ทางกฎหมายอย่างละเอียด

ในการประเมินเหล่านี้ Gemini 2.5 Pro Preview แสดงให้เห็นถึงความสามารถในการให้เหตุผลที่แข็งแกร่งในอินพุตที่ประกอบด้วยเนื้อหาหลายร้อยหน้า ซึ่งเป็นสถานการณ์ทั่วไปในงานด้านกฎหมาย นอกจากนี้ ยังสามารถใช้วัสดุเหล่านี้เพื่อสร้างเอาต์พุตแบบยาวและครอบคลุม ซึ่งช่วยให้ได้รับข้อมูลเชิงลึกและการวิเคราะห์ที่ลึกซึ้งยิ่งขึ้น ความสามารถหลักเหล่านี้แสดงให้เห็นถึงศักยภาพในการใช้ประโยชน์จาก Gemini 2.5 Pro Preview ในงานด้านกฎหมายที่ซับซ้อนซึ่งต้องใช้การให้เหตุผลในชุดเอกสารขนาดใหญ่เพื่อรองรับกรณีการใช้งานด้านการตรวจสอบ การตรวจสอบ และการร่างเอกสาร

มาตรฐานใหม่สำหรับ AI ด้านกฎหมาย

"ที่ Harvey เรามุ่งมั่นที่จะมอบเครื่องมือที่ล้ำสมัยที่สุดให้แก่ผู้เชี่ยวชาญด้านกฎหมาย" Niko Grupen หัวหน้าฝ่าย AI ประยุกต์ของ Harvey กล่าว "การประเมิน Gemini 2.5 Pro เวอร์ชันตัวอย่างผ่าน BigLaw Bench แสดงให้เห็นถึงความสามารถที่โดดเด่นในการสังเคราะห์ข้อมูลทางกฎหมายที่ซับซ้อน ข้อมูลเชิงลึกนี้เป็นแรงผลักดันวิสัยทัศน์ของเราในการพัฒนาผลิตภัณฑ์ในอนาคต โดยเรามุ่งมั่นที่จะใช้ประโยชน์จากจุดแข็งเหล่านี้เพื่อปลดล็อกประสิทธิภาพที่ไม่เคยมีมาก่อน และช่วยให้ทนายความมุ่งเน้นไปที่งานเชิงกลยุทธ์ระดับสูงได้"

ปลดล็อกอนาคตของงานด้านกฎหมาย

ความมุ่งมั่นของ Harvey ในการประเมินอย่างเข้มงวดและการวิเคราะห์เชิงลึกเกี่ยวกับโมเดล AI ที่ล้ำสมัย เช่น Gemini 2.5 Pro เวอร์ชันตัวอย่าง แสดงให้เห็นถึงศักยภาพในการเปลี่ยนแปลงของ AI ในสาขากฎหมาย ผลการวิจัยของพวกเขาปูทางสู่นวัตกรรมในอนาคตที่จะเปลี่ยนวิธีที่ผู้เชี่ยวชาญด้านกฎหมายเข้าถึงงานที่ท้าทายที่สุด

หากต้องการดูว่าความสามารถในการให้เหตุผลและการสังเคราะห์ขั้นสูงของ Gemini 2.5 Pro เวอร์ชันตัวอย่างจะช่วยขับเคลื่อนแอปพลิเคชันของคุณเองได้อย่างไร โปรดไปที่เอกสารประกอบของ Gemini API หรือเริ่มต้นใช้งานใน Google AI Studio

Harvey เป็นผู้เข้าร่วมกองทุน AI Futures ของ Google ซึ่งลงทุนและทำงานร่วมกับสตาร์ทอัพที่มีความมุ่งมั่นในการสร้างสิ่งใหม่ๆ ใน AI

Harvey: การตรวจสอบการให้เหตุผลทางกฎหมายขั้นสูงของ Gemini 2.5 Pro เวอร์ชันตัวอย่างด้วย BigLaw Bench

Harvey: การตรวจสอบการให้เหตุผลทางกฎหมายขั้นสูงของ Gemini 2.5 Pro เวอร์ชันตัวอย่างด้วย BigLaw Bench

เวอร์ชันตัวอย่างของ Gemini 2.5 Pro ได้รับการนำไปใช้ใน BigLaw Bench

มาตรฐานใหม่สำหรับ AI ด้านกฎหมาย

ปลดล็อกอนาคตของงานด้านกฎหมาย

กรณีศึกษาที่เกี่ยวข้อง