Gemma 3n เปิดตัวพร้อมอินพุตเสียงและเพิ่มประสิทธิภาพเพื่อใช้ในอุปกรณ์ทั่วไป ดูข้อมูลเพิ่มเติม

การปรับแต่งโมเดล Gemma

การปรับแต่งโมเดลปัญญาประดิษฐ์แบบ Generative (Generative AI) เช่น Gemma จะเป็นการแก้ไขลักษณะการทำงานของโมเดล โดยปกติแล้ว คุณจะปรับแต่ง Gemma เพื่อ ปรับปรุงประสิทธิภาพในงานหรือโดเมนที่เฉพาะเจาะจง หรือเพื่อ ทำหน้าที่ให้ดียิ่งขึ้น เช่น การบริการลูกค้า โมเดล Gemma เปิดตัวพร้อมกับน้ำหนักแบบเปิด ซึ่งหมายความว่าคุณสามารถแก้ไขน้ำหนักเหล่านั้นได้ ซึ่งจะเปลี่ยน ลักษณะการทำงานของโมเดล ขั้นตอนทั่วไปในการปรับแต่งโมเดล Gemma มีดังนี้

เลือกเฟรมเวิร์ก
รวบรวมข้อมูล
ปรับแต่งและทดสอบโมเดล
ทำให้โมเดลใช้งานได้

เลือกเฟรมเวิร์ก

โมเดล Gemma ใช้ได้กับเฟรมเวิร์กการปรับแต่ง AI ที่หลากหลาย เฟรมเวิร์กแต่ละรายการมีข้อดีต่างๆ และมักจะจำกัดไว้สำหรับ รูปแบบโมเดลที่เฉพาะเจาะจง ต่อไปนี้คือคำแนะนำในการปรับแต่งโมเดล Gemma ด้วยเฟรมเวิร์กต่างๆ

Keras ที่ใช้ LoRA
ไลบรารี Gemma สำหรับ JAX
Hugging Face
GKE ของ Google Cloud (GPU หลายตัวที่มี HF Transformers)
Vertex AI ของ Google Cloud
Unsloth
Axolotl
Keras ที่ใช้การปรับแบบกระจาย

ตรวจสอบว่าเฟรมเวิร์กที่คุณเลือกสนับสนุนรูปแบบโมเดลการติดตั้งใช้งานที่ต้องการ เช่น รูปแบบ Keras, Safetensors หรือ GGUF เป็นเอาต์พุต

รวบรวมข้อมูล

การปรับแต่งโมเดลต้องใช้ข้อมูล โดยปกติแล้วข้อมูลการปรับแต่งจะประกอบด้วยคู่ข้อมูลอินพุต พร้อมคำตอบที่คาดไว้ มีชุดข้อมูลสาธารณะมากมายที่พร้อมใช้งานทางออนไลน์ สำหรับการฝึกในงานหรือเอาต์พุตต่างๆ ตัวอย่างเช่น หากต้องการฝึกโมเดล Gemma ให้แปลคำอธิบายชิ้นส่วนรถยนต์เป็นหมายเลขชิ้นส่วน ชุดข้อมูลอาจมีข้อมูลต่อไปนี้

training_data = [
  {"input_text": "Part number for A4 brake caliper", "output_text": "4M0615107BS"},
  {"input_text": "Part number for Beetle fuel pump", "output_text": "6A127026H"},
  {"input_text": "Part number for Camaro cylinder head", "output_text": "12711770"},
]

หากต้องการให้โมเดล Gemma ทำงานหรือมีบทบาทที่เฉพาะเจาะจง คุณมักจะต้องรวบรวมชุดข้อมูลที่แสดงให้เห็นถึงรูปแบบต่างๆ ของงานนั้น ปริมาณข้อมูลที่ต้องใช้ในการปรับแต่งโมเดลขึ้นอยู่กับเป้าหมายของคุณ โดยเฉพาะอย่างยิ่ง การเปลี่ยนแปลงด้านพฤติกรรมที่คุณต้องการจากโมเดล และประสิทธิภาพของโมเดลที่คุณต้องการ โดยอิงตามงานที่จะทำให้สำเร็จและระดับ ความแปรปรวนในข้อมูลอินพุต

โดยทั่วไป คุณควรเริ่มต้นด้วยชุดข้อมูลขนาดเล็กสำหรับการปรับแต่งงาน ปรับพารามิเตอร์การฝึก และเพิ่มข้อมูลจนกว่าจะได้ประสิทธิภาพของงาน ที่ตรงกับความต้องการ แอปพลิเคชันตัวอย่างบางส่วนของเราแสดงให้เห็นว่าคุณสามารถ มีอิทธิพลต่อลักษณะการทำงานของโมเดล Gemma ได้ด้วยคู่พรอมต์และคำตอบเพียง 20 คู่ ดูรายละเอียดเพิ่มเติมได้ที่ สร้างผู้ช่วย AI สำหรับอีเมลธุรกิจด้วย Gemma และ งานในภาษาพูดด้วย Gemma

ปรับแต่งและทดสอบโมเดล

เมื่อมีเฟรมเวิร์กการปรับแต่งและข้อมูลการปรับแต่งแล้ว คุณจะเริ่มกระบวนการปรับแต่งโมเดล Gemma ได้ เมื่อทำการปรับแต่ง คุณจะมีตัวเลือกในการปรับแต่ง ซึ่งจะส่งผลต่อทรัพยากรที่คุณต้องใช้ในการปรับแต่งให้เสร็จสมบูรณ์ นอกจากนี้ คุณควรมีแผนการทดสอบสำหรับโมเดลที่ปรับแต่งแล้วเพื่อประเมินว่าโมเดลทำงานตามที่คุณต้องการหลังจากปรับแต่งหรือไม่

การปรับแต่งที่มีประสิทธิภาพด้านพารามิเตอร์

เมื่อปรับแต่งโมเดลแบบโอเพนเวท เช่น Gemma คุณจะมีตัวเลือกในการ ปรับแต่งพารามิเตอร์ทั้งหมดของโมเดล หรือใช้เทคนิคการปรับแต่งที่มีประสิทธิภาพของพารามิเตอร์ซึ่งใช้ทรัพยากรน้อยกว่า เพื่ออัปเดตชุดย่อยของพารามิเตอร์เหล่านั้น แนวทางการปรับแต่งแบบเต็มหมายความว่าเมื่อใช้ข้อมูลการปรับแต่ง คุณจะคำนวณน้ำหนักใหม่สำหรับพารามิเตอร์ทั้งหมดของโมเดล วิธีนี้ต้องใช้การประมวลผลและหน่วยความจำสูง เนื่องจากคุณทำการคำนวณเหล่านี้สำหรับพารามิเตอร์หลายพันล้านรายการ การใช้แนวทางการปรับแต่งที่ใช้ทรัพยากรน้อยลง ซึ่งเรียกว่าการปรับแต่งแบบละเอียดที่มีประสิทธิภาพของพารามิเตอร์ (PEFT) รวมถึง เทคนิคต่างๆ เช่น การปรับแต่ง Low Rank Adapter (LoRA) สามารถให้ผลลัพธ์ที่คล้ายกันโดยใช้ ทรัพยากรการคำนวณน้อยลง ดูรายละเอียดเกี่ยวกับวิธีปรับแต่งด้วยทรัพยากรน้อยลง โดยใช้ LoRA ได้ที่การปรับแต่งโมเดล Gemma ใน Keras โดยใช้ LoRA และการปรับแต่งโมเดล Gemma ใน Hugging Face

การทดสอบโมเดลที่ปรับแต่งแล้ว

เมื่อปรับแต่งโมเดลสำหรับงานที่เฉพาะเจาะจงแล้ว คุณควรทดสอบประสิทธิภาพของโมเดล กับชุดงานที่ต้องการให้โมเดลดำเนินการ คุณควรทดสอบโมเดลด้วย งานหรือคำขอที่ไม่ได้ฝึกโมเดลมาโดยเฉพาะ วิธีทดสอบโมเดลที่ปรับแต่งแล้วจะขึ้นอยู่กับงานที่คุณต้องการให้โมเดลทำและวิธีที่คุณจัดการอินพุตและเอาต์พุตสำหรับโมเดล วิธีทั่วไปในการจัดการการทดสอบโมเดล Generative คือการใช้กรณีที่สำเร็จ ล้มเหลว และก้ำกึ่ง

การทดสอบความสำเร็จ: คำขอที่โมเดลที่ปรับแต่งแล้วควรทำได้สำเร็จเสมอ
การทดสอบความล้มเหลว: คำขอที่โมเดลที่ปรับแต่งแล้วไม่ควรดำเนินการได้เสมอ หรือปฏิเสธที่จะดำเนินการอย่างชัดเจนหากมีการขอ
การทดสอบขอบเขต: คำขอที่โมเดลที่ปรับแต่งแล้วควรดำเนินการได้ หากคำขออยู่ภายในขอบเขตที่กำหนด หรือชุดขอบเขตของลักษณะการทำงานของเอาต์พุตที่ยอมรับได้

เมื่อทดสอบเงื่อนไขที่ทำให้แอปพลิเคชัน Generative AI ล้มเหลวหรือขอบเขตของแอปพลิเคชัน คุณควรใช้แนวทาง เทคนิค และเครื่องมือด้านความปลอดภัยของ Generative AI ตามที่อธิบายไว้ในชุดเครื่องมือ Generative AI ที่มีความรับผิดชอบด้วย

ทำให้โมเดลใช้งานได้

หลังจากปรับแต่งและทดสอบเสร็จเรียบร้อยแล้ว ก็ถึงเวลา นําโมเดลไปใช้งาน โดยปกติแล้ว คุณสามารถดูเอกสารประกอบของเฟรมเวิร์กที่เลือกเพื่อดูวิธีติดตั้งใช้งานโมเดลที่ปรับแต่งแล้ว ได้

หากคุณกําลังติดตั้งใช้งานโมเดลที่มีน้ำหนักที่ปรับแต่งด้วย LoRA โปรดทราบว่าเทคนิคนี้มักจะใช้ทั้งโมเดลต้นฉบับและน้ำหนักของโมเดล โดยมีน้ำหนัก LoRA เป็นเลเยอร์การคำนวณเพิ่มเติมสำหรับโมเดล