Gemma เป็นกลุ่มโมเดลแบบเปิดที่ทันสมัยและมีน้ำหนักเบา สร้างขึ้นจากการวิจัยและเทคโนโลยีเดียวกันกับที่ใช้สร้างโมเดล Gemini Gemma พัฒนาขึ้นโดย Google DeepMind และทีมอื่นๆ ใน Google โดยตั้งชื่อตามอัญมณีสไตล์ละติน ซึ่งหมายถึง "หินมีค่า" เครื่องมือสำหรับนักพัฒนาซอฟต์แวร์ที่สนับสนุนนวัตกรรม การทำงานร่วมกัน และการใช้ปัญญาประดิษฐ์ (AI) อย่างมีความรับผิดชอบ
โมเดลของ Gemma สามารถใช้ได้ในแอปพลิเคชันและฮาร์ดแวร์ อุปกรณ์เคลื่อนที่ หรือบริการที่โฮสต์ นอกจากนี้ คุณยังสามารถปรับแต่งโมเดลเหล่านี้โดยใช้เทคนิคการปรับแต่งเพื่อให้ทำงานที่สำคัญกับคุณและผู้ใช้ได้อย่างดีเยี่ยม โมเดลของ Gemma ได้รับแรงบันดาลใจและสายสายเทคโนโลยีจากตระกูลโมเดล Gemini และสร้างมาเพื่อชุมชนการพัฒนา AI ในการต่อยอดและต่อยอด
คุณสามารถใช้โมเดล Gemma ในการสร้างข้อความได้ แต่ก็สามารถปรับแต่งโมเดลเหล่านี้เพื่อทำงานบางอย่างโดยเฉพาะได้อีกด้วย โมเดล Gemma ที่ปรับแต่งจะช่วยให้คุณและผู้ใช้มีโซลูชัน Generative AI ที่ตรงเป้าหมายและมีประสิทธิภาพมากยิ่งขึ้น ดูคำแนะนำเกี่ยวกับการปรับแต่งด้วย LoRA และ ลองใช้งานเลย! เราตื่นเต้นที่จะได้เห็นสิ่งที่คุณสร้างกับ Gemma
เอกสารประกอบสำหรับนักพัฒนาซอฟต์แวร์นี้ให้ภาพรวมของโมเดล Gemma ที่มีอยู่และคู่มือการพัฒนาสำหรับวิธีการใช้และปรับแต่งโมเดลเหล่านั้นสำหรับแอปพลิเคชันที่เฉพาะเจาะจง
ขนาดและความสามารถของโมเดล
โมเดลของ Gemma มีให้เลือกหลากหลายขนาด คุณจึงสร้างโซลูชัน Generative AI ได้ตามทรัพยากรการประมวลผลที่มีอยู่ ความสามารถที่ต้องการ และตำแหน่งที่จะใช้งาน หากไม่แน่ใจว่าต้องเริ่มต้นตรงไหน ให้ลองใช้ขนาดพารามิเตอร์ 2B เพื่อให้มีข้อกำหนดด้านทรัพยากรต่ำลง และมีความยืดหยุ่นมากขึ้นในการติดตั้งใช้งานโมเดล
ขนาดของพารามิเตอร์ | อินพุต | เอาต์พุต | เวอร์ชันที่ปรับแต่ง | แพลตฟอร์มที่ต้องการ |
---|---|---|---|---|
2 พันล้าน | ข้อความ | ข้อความ |
|
อุปกรณ์เคลื่อนที่และแล็ปท็อป |
7 พันล้าน | ข้อความ | ข้อความ |
|
คอมพิวเตอร์เดสก์ท็อปและเซิร์ฟเวอร์ขนาดเล็ก |
หากใช้ฟีเจอร์ที่มีแบ็กเอนด์หลายระดับของ Keras 3.0 คุณจะเรียกใช้โมเดลเหล่านี้บน TensorFlow, JAX และ PyTorch หรือใช้การติดตั้งใช้งานในตัวกับ JAX (ตามเฟรมเวิร์ก FLAX) และ PyTorch
คุณสามารถดาวน์โหลดโมเดล Gemma จากโมเดล Kaggle หรือทำให้ใช้งานได้ใน Vertex AI
โมเดลที่ปรับแต่ง
คุณสามารถแก้ไขพฤติกรรมของโมเดล Gemma ได้ด้วยการฝึกเพิ่มเติม เพื่อให้โมเดลทำงานได้ดีขึ้นสำหรับงานที่เฉพาะเจาะจง กระบวนการนี้เรียกว่าการปรับแต่งโมเดล และแม้เทคนิคนี้จะปรับปรุงความสามารถของโมเดลในการทำงานเป้าหมาย แต่ก็อาจทำให้โมเดลแย่ลงในงานอื่นๆ ด้วย ด้วยเหตุนี้ โมเดลของ Gemma จึงมีให้ใช้ทั้งในเวอร์ชันที่มีการปรับแต่งและการฝึกล่วงหน้า
- ฝึกล่วงหน้าแล้ว - โมเดลเวอร์ชันเหล่านี้ไม่ได้รับการฝึกในงานหรือวิธีการที่เฉพาะเจาะจงที่นอกเหนือจากชุดการฝึกข้อมูลหลักของ Gemma คุณไม่ควรทำให้โมเดลเหล่านี้ใช้งานได้โดยไม่ได้ปรับแต่งบางอย่าง
- วิธีการปรับแต่ง - โมเดลเวอร์ชันเหล่านี้ได้รับการฝึกด้วยการโต้ตอบเป็นภาษามนุษย์และตอบสนองต่อการป้อนข้อมูลแบบการสนทนาได้ คล้ายกับแชทบ็อต
เริ่มต้นใช้งาน
ดูคู่มือต่อไปนี้เพื่อเริ่มสร้างโซลูชันกับ Gemma
- การสร้างข้อความด้วย Gemma - สร้างตัวอย่างการสร้างข้อความพื้นฐานด้วยโมเดล
- ปรับแต่ง Gemma ด้วยการปรับแต่ง LoRA - ปรับแต่ง LoRA อย่างละเอียดในโมเดล Gemma 2B
- ปรับแต่งโมเดล Gemma โดยใช้การฝึกแบบกระจาย - ใช้ Keras กับแบ็กเอนด์ JAX เพื่อปรับแต่งโมเดล Gemma 7B ด้วย LoRA และ โมเดลที่ทำงานพร้อมกัน
- Gemma ใน PyTorch - สร้างข้อความด้วย Gemma โดยใช้ PyTorch
- ทำให้ Gemma ใช้งานได้จริง - ใช้ Vertex AI เพื่อทำให้ Gemma ใช้งานได้จริง