เริ่มต้นใช้งานโมเดล Gemma

โมเดลแบบเปิดตระกูล Gemma มีขนาด ความสามารถ และรูปแบบที่เชี่ยวชาญด้านงานต่างๆ มากมายเพื่อช่วยคุณสร้างโซลูชัน Generative AI ที่กำหนดเอง เส้นทางหลักที่คุณทำตามได้เมื่อใช้โมเดล Gemma ในแอปพลิเคชันมีดังนี้

  • เลือกรุ่นและนําไปใช้ตามเดิมในแอปพลิเคชัน
  • เลือกโมเดล ปรับแต่งโมเดลสำหรับงานที่เฉพาะเจาะจง แล้วนําไปใช้งาน ในแอปพลิเคชัน หรือแชร์กับชุมชน

คู่มือนี้จะช่วยให้คุณเริ่มต้นเลือกโมเดล ทดสอบความสามารถของโมเดล และปรับแต่งโมเดลที่คุณเลือกสำหรับแอปพลิเคชันของคุณ (ไม่บังคับ)

ดาวน์โหลดใน Kaggle ดาวน์โหลดใน Hugging Face

เลือกโมเดล

ส่วนนี้จะช่วยให้คุณเข้าใจตัวแปรอย่างเป็นทางการของตระกูลโมเดล Gemma และเลือกโมเดลสำหรับแอปพลิเคชันของคุณ โมเดลเวอร์ชันต่างๆ มีความสามารถทั่วไปหรือมีความเชี่ยวชาญสำหรับงานที่เฉพาะเจาะจง และมีขนาดพารามิเตอร์ที่แตกต่างกันเพื่อให้คุณเลือกโมเดลที่มีความสามารถที่ต้องการและตรงตามข้อกำหนดด้านการประมวลผล

ตารางต่อไปนี้แสดงรายการโมเดลตระกูล Gemma ที่สำคัญและแพลตฟอร์มการติดตั้งใช้งานที่ตั้งใจไว้

Gemma 4 Family

รุ่นล่าสุดที่มีอินพุตหลายรูปแบบ (ข้อความ รูปภาพ เสียง)

ขนาด ตัวแปร อินพุต ➔ เอาต์พุต แพลตฟอร์มที่ต้องการ
E2B Gemma 4 (หลัก) ข้อความ รูปภาพ เสียง ➔ ข้อความ อุปกรณ์เคลื่อนที่
E4B Gemma 4 (หลัก) ข้อความ รูปภาพ เสียง ➔ ข้อความ อุปกรณ์เคลื่อนที่และแล็ปท็อป
A4B Gemma 4 (หลัก) ข้อความ รูปภาพ ➔ ข้อความ คอมพิวเตอร์เดสก์ท็อปและเซิร์ฟเวอร์ขนาดเล็ก
31B Gemma 4 (หลัก) ข้อความ รูปภาพ ➔ ข้อความ เซิร์ฟเวอร์ขนาดใหญ่หรือคลัสเตอร์เซิร์ฟเวอร์

ตระกูล Gemma 3 และ 3n

โมเดลหลักสำหรับการประมวลผลข้อความและรูปภาพที่รองรับการปรับขนาด รวมถึงโมเดล '3n' สำหรับอินพุตหลายรูปแบบที่ขยาย

ขนาด ตัวแปร อินพุต ➔ เอาต์พุต แพลตฟอร์มที่ต้องการ
270 ล้าน Gemma 3 (หลัก) ข้อความ ➔ ข้อความ อุปกรณ์เคลื่อนที่และคอมพิวเตอร์บอร์ดเดี่ยว
1 พันล้าน Gemma 3 (หลัก) ข้อความ ➔ ข้อความ อุปกรณ์เคลื่อนที่และคอมพิวเตอร์บอร์ดเดี่ยว
E2B Gemma 3n ข้อความ รูปภาพ เสียง ➔ ข้อความ อุปกรณ์เคลื่อนที่
4B Gemma 3 (หลัก) ข้อความ รูปภาพ ➔ ข้อความ คอมพิวเตอร์เดสก์ท็อปและเซิร์ฟเวอร์ขนาดเล็ก
E4B Gemma 3n ข้อความ รูปภาพ เสียง ➔ ข้อความ อุปกรณ์เคลื่อนที่และแล็ปท็อป
12B Gemma 3 (หลัก) ข้อความ รูปภาพ ➔ ข้อความ คอมพิวเตอร์เดสก์ท็อปและเซิร์ฟเวอร์ระดับสูง
27B Gemma 3 (หลัก) ข้อความ รูปภาพ ➔ ข้อความ เซิร์ฟเวอร์ขนาดใหญ่หรือคลัสเตอร์เซิร์ฟเวอร์

Gemma 2 Family

รวมถึงโมเดลข้อความมาตรฐานและโมเดล PaliGemma 2 ที่เป็นโมเดลวิทัศน์และภาษาแบบหลายรูปแบบ

ขนาด ตัวแปร อินพุต ➔ เอาต์พุต แพลตฟอร์มที่ต้องการ
2B Gemma 2 (หลัก) ข้อความ ➔ ข้อความ อุปกรณ์เคลื่อนที่และแล็ปท็อป
3B PaliGemma 2 ข้อความ รูปภาพ ➔ ข้อความ คอมพิวเตอร์เดสก์ท็อปและเซิร์ฟเวอร์ขนาดเล็ก
9B Gemma 2 (หลัก) ข้อความ ➔ ข้อความ คอมพิวเตอร์เดสก์ท็อปและเซิร์ฟเวอร์ระดับสูง
1 หมื่นล้าน PaliGemma 2 ข้อความ รูปภาพ ➔ ข้อความ คอมพิวเตอร์เดสก์ท็อปและเซิร์ฟเวอร์ระดับสูง
27B Gemma 2 (หลัก) ข้อความ ➔ ข้อความ เซิร์ฟเวอร์ขนาดใหญ่หรือคลัสเตอร์เซิร์ฟเวอร์
28B PaliGemma 2 ข้อความ รูปภาพ ➔ ข้อความ เซิร์ฟเวอร์ขนาดใหญ่หรือคลัสเตอร์เซิร์ฟเวอร์

Gemma 1 Family

รุ่นดั้งเดิม รวมถึงรุ่นที่เฉพาะเจาะจงสำหรับการเขียนโค้ด

ขนาด ตัวแปร อินพุต ➔ เอาต์พุต แพลตฟอร์มที่ต้องการ
2B Gemma (หลัก)
CodeGemma
ข้อความ ➔ ข้อความ อุปกรณ์เคลื่อนที่และแล็ปท็อป
7B Gemma (หลัก)
CodeGemma
ข้อความ ➔ ข้อความ คอมพิวเตอร์เดสก์ท็อปและเซิร์ฟเวอร์ขนาดเล็ก

โมเดลตระกูล Gemma ยังรวมถึงโมเดลเพื่อการวิจัยและโมเดลเฉพาะทาง ซึ่งรวมถึง ShieldGemma DataGemma Gemma Scope และ Gemma-APS

ทดสอบโมเดล

คุณสามารถทดสอบโมเดล Gemma ได้โดยการตั้งค่าสภาพแวดล้อมในการพัฒนาซอฟต์แวร์ด้วยโมเดลที่ดาวน์โหลดและซอฟต์แวร์ที่รองรับ จากนั้นคุณจะป้อนพรอมต์โมเดลและ ประเมินคำตอบได้ ใช้สมุดบันทึก Python อย่างใดอย่างหนึ่งต่อไปนี้กับเฟรมเวิร์กแมชชีนเลิร์นนิงที่คุณต้องการเพื่อตั้งค่าสภาพแวดล้อมการทดสอบและพรอมต์โมเดล Gemma

ปรับแต่งโมเดล

คุณเปลี่ยนลักษณะการทำงานของโมเดล Gemma ได้โดยการปรับแต่งโมเดล การปรับแต่งโมเดลต้องใช้ชุดข้อมูลของอินพุตและการตอบสนองที่คาดไว้ซึ่งมีขนาดและความหลากหลายเพียงพอ เพื่อเป็นแนวทางในการทำงานของโมเดล นอกจากนี้ คุณยังต้องมีทรัพยากรด้านการประมวลผลและหน่วยความจำมากกว่าเดิมอย่างมากเพื่อเรียกใช้การปรับแต่งให้เสร็จสมบูรณ์เมื่อเทียบกับการเรียกใช้โมเดล Gemma สำหรับการสร้างข้อความ ใช้สมุดบันทึก Python รายการใดรายการหนึ่งต่อไปนี้เพื่อ ตั้งค่าสภาพแวดล้อมในการพัฒนาซอฟต์แวร์การปรับแต่งและปรับแต่งโมเดล Gemma

ขั้นตอนถัดไป

ดูคำแนะนำต่อไปนี้เพื่อสร้างโซลูชันเพิ่มเติมด้วย Gemma