ลองดูที่เก็บ Gemma Cookbook เพื่อฟังตัวอย่างการสร้างและปรับแต่ง ดูข้อมูลเพิ่มเติม

หน้านี้ได้รับการแปลโดย Cloud Translation API

การปรับแต่งโมเดล Gemma

การปรับแต่งโมเดลปัญญาประดิษฐ์ (AI) แบบ Generative เช่น Gemma จะแก้ไขลักษณะการทํางานของโมเดล โดยปกติแล้ว คุณปรับแต่ง Gemma เพื่อปรับปรุงประสิทธิภาพของ Gemma ในบางงานหรือบางโดเมน หรือเพื่อทําบทบาทหนึ่งๆ ได้ดียิ่งขึ้น เช่น การบริการลูกค้า โมเดล Gemma จะเผยแพร่โดยเปิดค่าน้ำหนัก ซึ่งหมายความว่าคุณสามารถแก้ไขค่าน้ำหนักเหล่านั้นได้ ซึ่งจะเปลี่ยนลักษณะการทํางานของโมเดล ขั้นตอนทั่วไปในการปรับแต่งโมเดล Gemma มีดังนี้

เลือกเฟรมเวิร์ก
รวบรวมข้อมูล
ปรับแต่งและทดสอบโมเดล
ทำให้โมเดลใช้งานได้

เลือกเฟรมเวิร์ก

โมเดล Gemma ใช้ได้กับเฟรมเวิร์กการปรับ AI ที่หลากหลาย เฟรมเวิร์กแต่ละเฟรมเวิร์กมีข้อดีหลายประการ และมักจะมีข้อจํากัดในรูปแบบโมเดลที่เฉพาะเจาะจง คู่มือการปรับแต่งโมเดล Gemma ด้วยเฟรมเวิร์กต่างๆ มีดังนี้

Keras โดยใช้ LoRA
คลัง Gemma สำหรับ JAX
ใบหน้ากอด
Google Cloud GKE (GPU หลายตัวที่มี HF Transformers)
Unsloth
Axolotl
Keras ที่ใช้การปรับแต่งแบบกระจาย

ตรวจสอบว่าเฟรมเวิร์กที่คุณเลือกรองรับรูปแบบโมเดลสำหรับใช้งานจริง เช่น รูปแบบ Keras, รูปแบบ Safetensors หรือ GGUF ในรูปแบบเอาต์พุต

รวบรวมข้อมูล

การปรับโมเดลต้องใช้ข้อมูล โดยปกติข้อมูลการปรับแต่งจะประกอบด้วยคู่ข้อมูลอินพุตที่มีการตอบกลับที่คาดไว้ มีชุดข้อมูลสาธารณะจำนวนมากที่พร้อมให้ใช้งานทางออนไลน์เพื่อฝึกงานหรือเอาต์พุตต่างๆ ตัวอย่างเช่น หากต้องการฝึกโมเดล Gemma ให้แปลคำอธิบายชิ้นส่วนรถยนต์เป็นหมายเลขชิ้นส่วน ชุดข้อมูลของคุณอาจประกอบด้วยข้อมูลต่อไปนี้

training_data = [
  {"input_text": "Part number for A4 brake caliper", "output_text": "4M0615107BS"},
  {"input_text": "Part number for Beetle fuel pump", "output_text": "6A127026H"},
  {"input_text": "Part number for Camaro cylinder head", "output_text": "12711770"},
]

หากต้องการให้โมเดล Gemma ทํางานชุดงานหรือบทบาทที่เฉพาะเจาะจง คุณมักจะต้องรวบรวมชุดข้อมูลที่แสดงงานนั้นในหลายรูปแบบ ปริมาณข้อมูลที่จําเป็นในการปรับแต่งโมเดลจะขึ้นอยู่กับเป้าหมายของคุณ โดยเฉพาะอย่างยิ่ง ระดับการเปลี่ยนแปลงพฤติกรรมที่คุณต้องการจากโมเดลและประสิทธิภาพที่คุณต้องการให้โมเดลแสดงผลตามงานที่ต้องทำและระดับความหลากหลายของข้อมูลอินพุต

โดยทั่วไป คุณควรเริ่มต้นด้วยชุดข้อมูลขนาดเล็กสำหรับการปรับแต่งงาน ปรับพารามิเตอร์การฝึก และเพิ่มข้อมูลจนกว่าจะได้ประสิทธิภาพงานที่ตรงกับความต้องการของคุณ ตัวอย่างการใช้งานบางส่วนแสดงให้เห็นว่าคุณสามารถส่งผลต่อลักษณะการทํางานของโมเดล Gemma ได้ด้วยคู่พรอมต์และการตอบกลับเพียง 20 คู่ โปรดดูรายละเอียดเพิ่มเติมที่หัวข้อสร้างผู้ช่วย AI สำหรับอีเมลธุรกิจด้วย Gemma และทำงานในภาษาพูดด้วย Gemma

ปรับแต่งและทดสอบโมเดล

เมื่อคุณมีเฟรมเวิร์กการปรับแต่งและข้อมูลการปรับแต่งแล้ว ก็สามารถเริ่มกระบวนการปรับแต่งโมเดล Gemma ได้ เมื่อทำการปรับแต่ง คุณจะมีตัวเลือกบางอย่างในการปรับแต่ง ซึ่งส่งผลต่อทรัพยากรที่ต้องใช้เพื่อดำเนินการให้เสร็จสมบูรณ์ นอกจากนี้ คุณควรมีแผนการทดสอบสำหรับโมเดลที่ปรับแต่งแล้วเพื่อประเมินว่าโมเดลทำงานตามที่คุณต้องการหลังจากการปรับแต่งหรือไม่

การปรับแต่งพารามิเตอร์ที่มีประสิทธิภาพ

เมื่อปรับแต่งโมเดลน้ำหนักแบบเปิด เช่น Gemma คุณจะมีตัวเลือกในการปรับแต่งพารามิเตอร์ทั้งหมดของโมเดล หรือใช้เทคนิคการปรับแต่งพารามิเตอร์ที่มีประสิทธิภาพซึ่งใช้ทรัพยากรน้อยลงซึ่งจะอัปเดตชุดย่อยของพารามิเตอร์ วิธีการปรับแต่งแบบเต็มหมายความว่าเมื่อคุณใช้ข้อมูลการปรับแต่ง คุณจะคํานวณน้ำหนักใหม่สําหรับพารามิเตอร์ทั้งหมดของโมเดล วิธีการนี้ใช้การประมวลผลและหน่วยความจําอย่างหนัก เนื่องจากคุณกําลังทําการคํานวณเหล่านี้สําหรับพารามิเตอร์หลายพันล้านรายการ การใช้วิธีการปรับแต่งที่ไม่ต้องใช้ทรัพยากรมากนัก ซึ่งเรียกว่าการปรับแต่งพารามิเตอร์อย่างละเอียดที่มีประสิทธิภาพ (PEFT) รวมถึงเทคนิคต่างๆ เช่น การปรับ Low Rank Adapter (LoRA) จะให้ผลลัพธ์ที่คล้ายกันโดยใช้ทรัพยากรการประมวลผลน้อยลง โปรดดูรายละเอียดเกี่ยวกับวิธีปรับแต่งโดยใช้ทรัพยากรน้อยลงด้วย LoRA ที่หัวข้อปรับแต่งโมเดล Gemma ใน Keras โดยใช้ LoRA และหัวข้อการปรับแต่งโมเดล Gemma ใน Hugging Face

การทดสอบโมเดลที่ปรับแต่งแล้ว

เมื่อปรับแต่งโมเดลสําหรับงานหนึ่งๆ แล้ว คุณควรทดสอบประสิทธิภาพของโมเดลเทียบกับชุดงานที่ต้องการให้ทํา คุณควรทดสอบโมเดลด้วยงานหรือคําขอที่ไม่ได้ฝึกมาโดยเฉพาะ วิธีทดสอบโมเดลที่ปรับแต่งแล้วจะขึ้นอยู่กับงานที่ต้องการให้โมเดลทํา และวิธีที่คุณจัดการอินพุตและเอาต์พุตของโมเดล วิธีทั่วไปในการจัดการการทดสอบโมเดล Generative คือการใช้กรณีสำเร็จ กรณีไม่สําเร็จ และกรณีใกล้เคียงกัน ดังนี้

การทดสอบความสําเร็จ: ขอให้โมเดลที่ปรับแต่งแล้วทํางานได้สําเร็จเสมอ
การทดสอบการทำงานผิดพลาด: คำขอที่ระบุว่าโมเดลที่ปรับแต่งแล้วไม่ควรทํางานได้เสมอ หรือปฏิเสธที่จะทํางานอย่างชัดเจน หากได้รับคําขอ
การทดสอบขอบเขต: คำขอที่โมเดลที่ปรับแต่งแล้วควรทํางานได้ หากอยู่ภายในขอบเขตหรือชุดขอบเขตที่กําหนดไว้ของลักษณะการทํางานของเอาต์พุตที่ยอมรับได้

เมื่อทดสอบเงื่อนไขขอบเขตหรือข้อผิดพลาดของแอปพลิเคชัน Generative AI คุณควรใช้แนวทาง เทคนิค และเครื่องมือด้านความปลอดภัยของ Generative AI ตามที่อธิบายไว้ในชุดเครื่องมือ Generative AI ที่มีความรับผิดชอบ

ทำให้โมเดลใช้งานได้

หลังจากปรับแต่งและทดสอบเรียบร้อยแล้ว ก็ถึงเวลาทำให้โมเดลใช้งานได้ โดยปกติแล้ว คุณสามารถดูวิธีทำให้โมเดลที่ปรับแต่งแล้วใช้งานได้ในเอกสารประกอบของเฟรมเวิร์กที่คุณเลือก

หากคุณกำลังใช้งานโมเดลที่มีน้ำหนักที่ปรับ LoRA โปรดทราบว่าโดยทั่วไปแล้วเทคนิคนี้จะใช้ทั้งโมเดลเดิมและน้ำหนักของโมเดลนั้นร่วมกับน้ำหนัก LoRA เป็นชั้นการคํานวณเพิ่มเติมสําหรับโมเดล