การปรับแต่งโมเดล Gemma

การปรับแต่งโมเดลปัญญาประดิษฐ์ (AI) แบบ Generative เช่น Gemma จะแก้ไขลักษณะการทํางานของโมเดล โดยปกติแล้ว คุณปรับแต่ง Gemma เพื่อปรับปรุงประสิทธิภาพของ Gemma ในบางงานหรือบางโดเมน หรือเพื่อทําบทบาทหนึ่งๆ ได้ดียิ่งขึ้น เช่น การบริการลูกค้า โมเดล Gemma จะเผยแพร่โดยเปิดค่าน้ำหนัก ซึ่งหมายความว่าคุณสามารถแก้ไขค่าน้ำหนักเหล่านั้นได้ ซึ่งจะเปลี่ยนลักษณะการทํางานของโมเดล ขั้นตอนทั่วไปในการปรับแต่งโมเดล Gemma มีดังนี้

เลือกเฟรมเวิร์ก

โมเดล Gemma ใช้ได้กับเฟรมเวิร์กการปรับ AI ที่หลากหลาย เฟรมเวิร์กแต่ละเฟรมเวิร์กมีข้อดีหลายประการ และมักจะมีข้อจํากัดในรูปแบบโมเดลที่เฉพาะเจาะจง คู่มือการปรับแต่งโมเดล Gemma ด้วยเฟรมเวิร์กต่างๆ มีดังนี้

ตรวจสอบว่าเฟรมเวิร์กที่คุณเลือกรองรับรูปแบบโมเดลสำหรับใช้งานจริง เช่น รูปแบบ Keras, รูปแบบ Safetensors หรือ GGUF ในรูปแบบเอาต์พุต

รวบรวมข้อมูล

การปรับโมเดลต้องใช้ข้อมูล โดยปกติข้อมูลการปรับแต่งจะประกอบด้วยคู่ข้อมูลอินพุตที่มีการตอบกลับที่คาดไว้ มีชุดข้อมูลสาธารณะจำนวนมากที่พร้อมให้ใช้งานทางออนไลน์เพื่อฝึกงานหรือเอาต์พุตต่างๆ ตัวอย่างเช่น หากต้องการฝึกโมเดล Gemma ให้แปลคำอธิบายชิ้นส่วนรถยนต์เป็นหมายเลขชิ้นส่วน ชุดข้อมูลของคุณอาจประกอบด้วยข้อมูลต่อไปนี้

training_data = [
  {"input_text": "Part number for A4 brake caliper", "output_text": "4M0615107BS"},
  {"input_text": "Part number for Beetle fuel pump", "output_text": "6A127026H"},
  {"input_text": "Part number for Camaro cylinder head", "output_text": "12711770"},
]

หากต้องการให้โมเดล Gemma ทํางานชุดงานหรือบทบาทที่เฉพาะเจาะจง คุณมักจะต้องรวบรวมชุดข้อมูลที่แสดงงานนั้นในหลายรูปแบบ ปริมาณข้อมูลที่จําเป็นในการปรับแต่งโมเดลจะขึ้นอยู่กับเป้าหมายของคุณ โดยเฉพาะอย่างยิ่ง ระดับการเปลี่ยนแปลงพฤติกรรมที่คุณต้องการจากโมเดลและประสิทธิภาพที่คุณต้องการให้โมเดลแสดงผลตามงานที่ต้องทำและระดับความหลากหลายของข้อมูลอินพุต

โดยทั่วไป คุณควรเริ่มต้นด้วยชุดข้อมูลขนาดเล็กสำหรับการปรับแต่งงาน ปรับพารามิเตอร์การฝึก และเพิ่มข้อมูลจนกว่าจะได้ประสิทธิภาพงานที่ตรงกับความต้องการของคุณ ตัวอย่างการใช้งานบางส่วนแสดงให้เห็นว่าคุณสามารถส่งผลต่อลักษณะการทํางานของโมเดล Gemma ได้ด้วยคู่พรอมต์และการตอบกลับเพียง 20 คู่ โปรดดูรายละเอียดเพิ่มเติมที่หัวข้อสร้างผู้ช่วย AI สำหรับอีเมลธุรกิจด้วย Gemma และทำงานในภาษาพูดด้วย Gemma

ปรับแต่งและทดสอบโมเดล

เมื่อคุณมีเฟรมเวิร์กการปรับแต่งและข้อมูลการปรับแต่งแล้ว ก็สามารถเริ่มกระบวนการปรับแต่งโมเดล Gemma ได้ เมื่อทำการปรับแต่ง คุณจะมีตัวเลือกบางอย่างในการปรับแต่ง ซึ่งส่งผลต่อทรัพยากรที่ต้องใช้เพื่อดำเนินการให้เสร็จสมบูรณ์ นอกจากนี้ คุณควรมีแผนการทดสอบสำหรับโมเดลที่ปรับแต่งแล้วเพื่อประเมินว่าโมเดลทำงานตามที่คุณต้องการหลังจากการปรับแต่งหรือไม่

การปรับแต่งพารามิเตอร์ที่มีประสิทธิภาพ

เมื่อปรับแต่งโมเดลน้ำหนักแบบเปิด เช่น Gemma คุณจะมีตัวเลือกในการปรับแต่งพารามิเตอร์ทั้งหมดของโมเดล หรือใช้เทคนิคการปรับแต่งพารามิเตอร์ที่มีประสิทธิภาพซึ่งใช้ทรัพยากรน้อยลงซึ่งจะอัปเดตชุดย่อยของพารามิเตอร์ วิธีการปรับแต่งแบบเต็มหมายความว่าเมื่อคุณใช้ข้อมูลการปรับแต่ง คุณจะคํานวณน้ำหนักใหม่สําหรับพารามิเตอร์ทั้งหมดของโมเดล วิธีการนี้ใช้การประมวลผลและหน่วยความจําอย่างหนัก เนื่องจากคุณกําลังทําการคํานวณเหล่านี้สําหรับพารามิเตอร์หลายพันล้านรายการ การใช้วิธีการปรับแต่งที่ไม่ต้องใช้ทรัพยากรมากนัก ซึ่งเรียกว่าการปรับแต่งพารามิเตอร์อย่างละเอียดที่มีประสิทธิภาพ (PEFT) รวมถึงเทคนิคต่างๆ เช่น การปรับ Low Rank Adapter (LoRA) จะให้ผลลัพธ์ที่คล้ายกันโดยใช้ทรัพยากรการประมวลผลน้อยลง โปรดดูรายละเอียดเกี่ยวกับวิธีปรับแต่งโดยใช้ทรัพยากรน้อยลงด้วย LoRA ที่หัวข้อปรับแต่งโมเดล Gemma ใน Keras โดยใช้ LoRA และหัวข้อการปรับแต่งโมเดล Gemma ใน Hugging Face

การทดสอบโมเดลที่ปรับแต่งแล้ว

เมื่อปรับแต่งโมเดลสําหรับงานหนึ่งๆ แล้ว คุณควรทดสอบประสิทธิภาพของโมเดลเทียบกับชุดงานที่ต้องการให้ทํา คุณควรทดสอบโมเดลด้วยงานหรือคําขอที่ไม่ได้ฝึกมาโดยเฉพาะ วิธีทดสอบโมเดลที่ปรับแต่งแล้วจะขึ้นอยู่กับงานที่ต้องการให้โมเดลทํา และวิธีที่คุณจัดการอินพุตและเอาต์พุตของโมเดล วิธีทั่วไปในการจัดการการทดสอบโมเดล Generative คือการใช้กรณีสำเร็จ กรณีไม่สําเร็จ และกรณีใกล้เคียงกัน ดังนี้

  • การทดสอบความสําเร็จ: ขอให้โมเดลที่ปรับแต่งแล้วทํางานได้สําเร็จเสมอ
  • การทดสอบการทำงานผิดพลาด: คำขอที่ระบุว่าโมเดลที่ปรับแต่งแล้วไม่ควรทํางานได้เสมอ หรือปฏิเสธที่จะทํางานอย่างชัดเจน หากได้รับคําขอ
  • การทดสอบขอบเขต: คำขอที่โมเดลที่ปรับแต่งแล้วควรทํางานได้ หากอยู่ภายในขอบเขตหรือชุดขอบเขตที่กําหนดไว้ของลักษณะการทํางานของเอาต์พุตที่ยอมรับได้

เมื่อทดสอบเงื่อนไขขอบเขตหรือข้อผิดพลาดของแอปพลิเคชัน Generative AI คุณควรใช้แนวทาง เทคนิค และเครื่องมือด้านความปลอดภัยของ Generative AI ตามที่อธิบายไว้ในชุดเครื่องมือ Generative AI ที่มีความรับผิดชอบ

ทำให้โมเดลใช้งานได้

หลังจากปรับแต่งและทดสอบเรียบร้อยแล้ว ก็ถึงเวลาทำให้โมเดลใช้งานได้ โดยปกติแล้ว คุณสามารถดูวิธีทำให้โมเดลที่ปรับแต่งแล้วใช้งานได้ในเอกสารประกอบของเฟรมเวิร์กที่คุณเลือก

หากคุณกำลังใช้งานโมเดลที่มีน้ำหนักที่ปรับ LoRA โปรดทราบว่าโดยทั่วไปแล้วเทคนิคนี้จะใช้ทั้งโมเดลเดิมและน้ำหนักของโมเดลนั้นร่วมกับน้ำหนัก LoRA เป็นชั้นการคํานวณเพิ่มเติมสําหรับโมเดล