SynthID: เครื่องมือสำหรับการใส่ลายน้ำและตรวจหาข้อความที่ LLM สร้างขึ้น

ปัญญาประดิษฐ์ (AI) แบบ Generative (GenAI) สามารถสร้างเนื้อหาที่หลากหลายได้ในวงกว้างขึ้นในระดับที่ไม่เคยมีมาก่อน แม้ว่าการใช้งานส่วนใหญ่จะมีจุดประสงค์ที่ถูกต้อง แต่เราก็มีความกังวลว่าอาจทำให้เกิดปัญหาการให้ข้อมูลที่ไม่ถูกต้องและการระบุแหล่งที่มาที่ไม่ถูกต้อง การใส่ลายน้ำเป็นเทคนิคหนึ่งในการ ในการลดผลกระทบที่อาจเกิดขึ้น ลายน้ำที่มนุษย์มองไม่เห็นสามารถใช้กับเนื้อหาที่ AI สร้างขึ้นได้ และโมเดลการตรวจจับสามารถให้คะแนนเนื้อหาแบบกำหนดเองเพื่อระบุแนวโน้มว่าเนื้อหามีลายน้ำหรือไม่

SynthID เป็นเทคโนโลยีจาก Google DeepMind ที่ใส่ลายน้ำและ ระบุเนื้อหาที่ AI สร้างขึ้นโดยการฝังลายน้ำดิจิทัลลงใน รูปภาพ เสียง ข้อความ หรือวิดีโอที่ AI สร้างขึ้น SynthID Text เป็นโอเพนซอร์สเพื่อให้นักพัฒนาซอฟต์แวร์สามารถใช้ลายน้ำสำหรับการสร้างข้อความได้ คุณสามารถอ่านบทความใน Nature เพื่อดูคำอธิบายทางเทคนิคที่สมบูรณ์ยิ่งขึ้นเกี่ยวกับวิธีการนี้

การใช้งานข้อความ SynthID Text ระดับเวอร์ชันที่ใช้งานจริงมีให้บริการใน Hugging Face Transformers เวอร์ชัน 4.46.0 ขึ้นไปที่ทดลองใช้ได้ใน SynthID Text Space อย่างเป็นทางการ การใช้งานอ้างอิงยังพร้อมให้ใช้งานใน GitHub ซึ่งอาจเป็นประโยชน์สำหรับผู้ดูแลโอเพนซอร์สและผู้มีส่วนร่วมที่ต้องการนําเทคนิคนี้ไปใช้กับเฟรมเวิร์กอื่นๆ

การใช้ลายน้ำ

ในทางปฏิบัติ SynthID Text คือตัวประมวลผลลอจิทที่ใช้กับไปป์ไลน์การสร้างของโมเดลหลังจาก Top-K และ Top-P ซึ่งจะเพิ่มลอจิทของโมเดลโดยใช้ฟังก์ชัน g แบบสุ่มจำลองเพื่อเข้ารหัสข้อมูลลายน้ำในลักษณะที่ปรับสมดุลคุณภาพการสร้างกับความสามารถในการตรวจจับลายน้ำ ดูบทความทั้งหมด คำอธิบายทางเทคนิคของอัลกอริทึมและการวิเคราะห์ความแตกต่าง การกำหนดค่ามีผลต่อประสิทธิภาพ

กําหนดค่าลายน้ำเพื่อกำหนดพารามิเตอร์ของฟังก์ชัน g และวิธีใช้ระหว่างการสร้าง แต่ละโมเดลที่คุณใช้ควร มีการกำหนดค่าลายน้ำของตัวเอง ควรจัดเก็บอย่างปลอดภัยและเป็นส่วนตัว มิฉะนั้นแล้วลายน้ำของคุณอาจมีลักษณะดังนี้ เลียนแบบได้เล็กน้อย

คุณต้องกำหนดพารามิเตอร์ 2 รายการในการกำหนดค่าลายน้ำทุกครั้ง ดังนี้

  • พารามิเตอร์ keys คือรายการจำนวนเต็มแบบสุ่มที่ไม่ซ้ำกันซึ่งใช้ในการคํานวณคะแนนฟังก์ชัน g ในคําศัพท์ของโมเดล ความยาวของรายการนี้จะกำหนดจำนวนเลเยอร์ของลายน้ำที่จะใช้ โปรดดู ภาคผนวก C.1 ในเอกสารเพื่อดูรายละเอียดเพิ่มเติม
  • พารามิเตอร์ ngram_len ใช้เพื่อสร้างความสมดุลระหว่างความทนทานและการตรวจจับ ยิ่งค่ายิ่งสูงขึ้นเท่าใด ลายน้ำก็จะตรวจจับได้มากขึ้นเท่านั้น จะเปราะบางต่อการเปลี่ยนแปลงมากขึ้น ความยาว 5 เป็นค่าเริ่มต้นที่ดี

คุณกำหนดค่าลายน้ำเพิ่มเติมตามความต้องการด้านประสิทธิภาพได้ดังนี้

  • จะมีการกำหนดค่าตารางการสุ่มตัวอย่างโดยพร็อพเพอร์ตี้ 2 รายการ ได้แก่ sampling_table_size และ sampling_table_seed คุณควรใช้ sampling_table_size อย่างน้อย\( 2^{16} \) เพื่อให้แน่ใจว่าฟังก์ชัน g จะไม่ลำเอียงและเสถียรเมื่อทำการสุ่มตัวอย่าง แต่โปรดทราบว่าขนาดของตารางการสุ่มตัวอย่างจะส่งผลต่อปริมาณหน่วยความจำที่จําเป็น ณ เวลาอนุมาน คุณสามารถใช้จำนวนเต็มใดก็ได้ที่ต้องการเป็นค่า sampling_table_seed
  • ระบบจะไม่ใส่ลายน้ำใน n-gram ที่ซ้ำกันของโทเค็นก่อนหน้า context_history_size รายการเพื่อปรับปรุงความสามารถในการตรวจจับ

คุณไม่จำเป็นต้องฝึกโมเดลเพิ่มเติมเพื่อสร้างข้อความที่มีลายน้ำข้อความ SynthID โดยใช้โมเดลของคุณ เพียงแค่การกำหนดค่าลายน้ำที่ส่งไปยัง.generate()เมธอดของโมเดลเพื่อเปิดใช้งานโปรแกรมประมวลผล Logit ของข้อความ SynthID ดูตัวอย่างโค้ดที่แสดงวิธีใส่ลายน้ำในไลบรารี Transformers ได้ที่บล็อกโพสต์และ Space

การตรวจหาและยืนยันลายน้ำ

การตรวจหาลายน้ำเป็นเรื่องที่เป็นไปได้ เรามีเครื่องตรวจหาแบบเบย์เซียนพร้อมให้ใช้งานใน Hugging Face Transformers และบน GitHub เครื่องมือตรวจจับนี้จะแสดงผลสถานะการตรวจจับได้ 3 สถานะ ได้แก่ มีลายน้ำ ไม่มีลายน้ำ หรือไม่แน่ใจ และคุณปรับแต่งลักษณะการทํางานได้โดยการตั้งค่าเกณฑ์ 2 ค่า โปรดดูภาคผนวก C.8 ใน กระดาษเพื่อดูรายละเอียดเพิ่มเติม

คุณสามารถปรับเกณฑ์เพื่อให้ได้ผลบวกลวงและเท็จที่เฉพาะเจาะจง อัตราลบของชุดข้อความแจ้งหรือความยาว ดูรายละเอียดได้ในภาคผนวก C.8 ในบทความ

เมื่อมีอุปกรณ์ตรวจจับที่ผ่านการฝึกอบรมแล้ว คุณจะเลือกได้ว่าเปิดอุปกรณ์หรือไม่และอย่างไร แก่ผู้ใช้และสาธารณชนโดยทั่วไป

  • ตัวเลือกส่วนตัวทั้งหมดจะไม่เผยแพร่หรือแสดงตัวตรวจจับไม่ว่าในทางใดก็ตาม
  • ตัวเลือกแบบกึ่งส่วนตัวจะไม่ปล่อยตัวตรวจจับ แต่จะแสดงผ่าน API
  • ตัวเลือกสาธารณะจะเผยแพร่ตัวตรวจจับให้ผู้อื่นดาวน์โหลดและใช้งาน

คุณและองค์กรต้องตัดสินใจว่าจะใช้การยืนยันการตรวจจับแบบใด เหมาะกับความต้องการของคุณมากที่สุด โดยพิจารณาจากความสามารถในการสนับสนุน โครงสร้างพื้นฐานและกระบวนการต่างๆ

ข้อจำกัด

ลายน้ำของข้อความ SynthID มีประสิทธิภาพสำหรับการเปลี่ยนรูปแบบบางอย่าง เช่น การครอบตัดส่วนเนื้อหา แก้ไขคำเล็กน้อย หรือการถอดความที่ไม่รุนแรง แต่วิธีนี้ มีข้อจำกัด

  • การใช้ลายน้ำจะมีประสิทธิภาพน้อยกว่าในคำตอบที่เป็นข้อเท็จจริง เนื่องจากมี ก็มีโอกาสน้อยลงที่จะส่งเสริมการสร้างโดยไม่ทำให้ความแม่นยำลดลง
  • คะแนนความเชื่อมั่นของตัวตรวจจับอาจลดลงอย่างมากเมื่อมีการเขียนข้อความที่ AI สร้างขึ้นใหม่อย่างละเอียด หรือแปลเป็นภาษาอื่น

ข้อความ SynthID ไม่ได้ออกแบบมาเพื่อหยุดผู้ไม่ประสงค์ดีที่มีแรงจูงใจไม่ให้ก่ออันตรายโดยตรง อย่างไรก็ตาม การตรวจสอบนี้อาจทำให้การใช้เนื้อหาที่ AI สร้างขึ้นเพื่อวัตถุประสงค์ที่เป็นอันตรายทำได้ยากขึ้น และสามารถนำมารวมกับแนวทางอื่นๆ เพื่อให้ครอบคลุมเนื้อหาและแพลตฟอร์มต่างๆ ได้ดีขึ้น