หน้านี้ได้รับการแปลโดย Cloud Translation API

ภาพรวมโมเดลของ Gemma

Gemma เป็นกลุ่มโมเดลแบบเปิดที่ทันสมัยและมีน้ำหนักเบา สร้างขึ้นจากการวิจัยและเทคโนโลยีเดียวกันกับที่ใช้สร้างโมเดล Gemini Gemma พัฒนาขึ้นโดย Google DeepMind และทีมอื่นๆ ใน Google โดยตั้งชื่อตามอัญมณีสไตล์ละติน ซึ่งหมายถึง "หินมีค่า" เครื่องมือสำหรับนักพัฒนาซอฟต์แวร์ที่สนับสนุนนวัตกรรม การทำงานร่วมกัน และการใช้ปัญญาประดิษฐ์ (AI) อย่างมีความรับผิดชอบ

โมเดลของ Gemma สามารถใช้ได้ในแอปพลิเคชันและฮาร์ดแวร์ อุปกรณ์เคลื่อนที่ หรือบริการที่โฮสต์ นอกจากนี้ คุณยังสามารถปรับแต่งโมเดลเหล่านี้โดยใช้เทคนิคการปรับแต่งเพื่อให้ทำงานที่สำคัญกับคุณและผู้ใช้ได้อย่างดีเยี่ยม โมเดลของ Gemma ได้รับแรงบันดาลใจและสายสายเทคโนโลยีจากตระกูลโมเดล Gemini และสร้างมาเพื่อชุมชนการพัฒนา AI ในการต่อยอดและต่อยอด

คุณสามารถใช้โมเดล Gemma ในการสร้างข้อความได้ แต่ก็สามารถปรับแต่งโมเดลเหล่านี้เพื่อทำงานบางอย่างโดยเฉพาะได้อีกด้วย โมเดล Gemma ที่ปรับแต่งจะช่วยให้คุณและผู้ใช้มีโซลูชัน Generative AI ที่ตรงเป้าหมายและมีประสิทธิภาพมากยิ่งขึ้น ดูคำแนะนำเกี่ยวกับการปรับแต่งด้วย LoRA และ ลองใช้งานเลย! เราตื่นเต้นที่จะได้เห็นสิ่งที่คุณสร้างกับ Gemma

เอกสารประกอบสำหรับนักพัฒนาซอฟต์แวร์นี้ให้ภาพรวมของโมเดล Gemma ที่มีอยู่และคู่มือการพัฒนาสำหรับวิธีการใช้และปรับแต่งโมเดลเหล่านั้นสำหรับแอปพลิเคชันที่เฉพาะเจาะจง

ขนาดและความสามารถของโมเดล

โมเดลของ Gemma มีให้เลือกหลากหลายขนาด คุณจึงสร้างโซลูชัน Generative AI ได้ตามทรัพยากรการประมวลผลที่มีอยู่ ความสามารถที่ต้องการ และตำแหน่งที่จะใช้งาน หากไม่แน่ใจว่าต้องเริ่มต้นตรงไหน ให้ลองใช้ขนาดพารามิเตอร์ 2B เพื่อให้มีข้อกำหนดด้านทรัพยากรต่ำลง และมีความยืดหยุ่นมากขึ้นในการติดตั้งใช้งานโมเดล

ขนาดของพารามิเตอร์	อินพุต	เอาต์พุต	เวอร์ชันที่ปรับแต่ง	แพลตฟอร์มที่ต้องการ
2 พันล้าน	ข้อความ	ข้อความ	ฝึกล่วงหน้า ปรับวิธีการแล้ว	อุปกรณ์เคลื่อนที่และแล็ปท็อป
7 พันล้าน	ข้อความ	ข้อความ	ฝึกล่วงหน้า ปรับวิธีการแล้ว	คอมพิวเตอร์เดสก์ท็อปและเซิร์ฟเวอร์ขนาดเล็ก

ขนาดของพารามิเตอร์

อินพุต

เอาต์พุต

เวอร์ชันที่ปรับแต่ง

แพลตฟอร์มที่ต้องการ

2 พันล้าน

ข้อความ

ฝึกล่วงหน้า

ปรับวิธีการแล้ว

อุปกรณ์เคลื่อนที่และแล็ปท็อป

7 พันล้าน

ข้อความ

ฝึกล่วงหน้า

ปรับวิธีการแล้ว

คอมพิวเตอร์เดสก์ท็อปและเซิร์ฟเวอร์ขนาดเล็ก

หากใช้ฟีเจอร์ที่มีแบ็กเอนด์หลายระดับของ Keras 3.0 คุณจะเรียกใช้โมเดลเหล่านี้บน TensorFlow, JAX และ PyTorch หรือใช้การติดตั้งใช้งานในตัวกับ JAX (ตามเฟรมเวิร์ก FLAX) และ PyTorch

คุณสามารถดาวน์โหลดโมเดล Gemma จากโมเดล Kaggle หรือทำให้ใช้งานได้ใน Vertex AI

โมเดลที่ปรับแต่ง

คุณสามารถแก้ไขพฤติกรรมของโมเดล Gemma ได้ด้วยการฝึกเพิ่มเติม เพื่อให้โมเดลทำงานได้ดีขึ้นสำหรับงานที่เฉพาะเจาะจง กระบวนการนี้เรียกว่าการปรับแต่งโมเดล และแม้เทคนิคนี้จะปรับปรุงความสามารถของโมเดลในการทำงานเป้าหมาย แต่ก็อาจทำให้โมเดลแย่ลงในงานอื่นๆ ด้วย ด้วยเหตุนี้ โมเดลของ Gemma จึงมีให้ใช้ทั้งในเวอร์ชันที่มีการปรับแต่งและการฝึกล่วงหน้า

ฝึกล่วงหน้าแล้ว - โมเดลเวอร์ชันเหล่านี้ไม่ได้รับการฝึกในงานหรือวิธีการที่เฉพาะเจาะจงที่นอกเหนือจากชุดการฝึกข้อมูลหลักของ Gemma คุณไม่ควรทำให้โมเดลเหล่านี้ใช้งานได้โดยไม่ได้ปรับแต่งบางอย่าง
วิธีการปรับแต่ง - โมเดลเวอร์ชันเหล่านี้ได้รับการฝึกด้วยการโต้ตอบเป็นภาษามนุษย์และตอบสนองต่อการป้อนข้อมูลแบบการสนทนาได้ คล้ายกับแชทบ็อต

เริ่มต้นใช้งาน

ดูคู่มือต่อไปนี้เพื่อเริ่มสร้างโซลูชันกับ Gemma

การสร้างข้อความด้วย Gemma - สร้างตัวอย่างการสร้างข้อความพื้นฐานด้วยโมเดล
ปรับแต่ง Gemma ด้วยการปรับแต่ง LoRA - ปรับแต่ง LoRA อย่างละเอียดในโมเดล Gemma 2B
ปรับแต่งโมเดล Gemma โดยใช้การฝึกแบบกระจาย - ใช้ Keras กับแบ็กเอนด์ JAX เพื่อปรับแต่งโมเดล Gemma 7B ด้วย LoRA และ โมเดลที่ทำงานพร้อมกัน
Gemma ใน PyTorch - สร้างข้อความด้วย Gemma โดยใช้ PyTorch
ทำให้ Gemma ใช้งานได้จริง - ใช้ Vertex AI เพื่อทำให้ Gemma ใช้งานได้จริง