ภาพรวมโมเดลของ Gemma

Gemma เป็นกลุ่มโมเดลแบบเปิดที่ทันสมัยและมีน้ำหนักเบา สร้างขึ้นจากการวิจัยและเทคโนโลยีเดียวกันกับที่ใช้สร้างโมเดล Gemini Gemma พัฒนาขึ้นโดย Google DeepMind และทีมอื่นๆ ใน Google โดยตั้งชื่อตามอัญมณีสไตล์ละติน ซึ่งหมายถึง "หินมีค่า" เครื่องมือสำหรับนักพัฒนาซอฟต์แวร์ที่สนับสนุนนวัตกรรม การทำงานร่วมกัน และการใช้ปัญญาประดิษฐ์ (AI) อย่างมีความรับผิดชอบ

โมเดลของ Gemma สามารถใช้ได้ในแอปพลิเคชันและฮาร์ดแวร์ อุปกรณ์เคลื่อนที่ หรือบริการที่โฮสต์ นอกจากนี้ คุณยังสามารถปรับแต่งโมเดลเหล่านี้โดยใช้เทคนิคการปรับแต่งเพื่อให้ทำงานที่สำคัญกับคุณและผู้ใช้ได้อย่างดีเยี่ยม โมเดลของ Gemma ได้รับแรงบันดาลใจและสายสายเทคโนโลยีจากตระกูลโมเดล Gemini และสร้างมาเพื่อชุมชนการพัฒนา AI ในการต่อยอดและต่อยอด

คุณสามารถใช้โมเดล Gemma ในการสร้างข้อความได้ แต่ก็สามารถปรับแต่งโมเดลเหล่านี้เพื่อทำงานบางอย่างโดยเฉพาะได้อีกด้วย โมเดล Gemma ที่ปรับแต่งจะช่วยให้คุณและผู้ใช้มีโซลูชัน Generative AI ที่ตรงเป้าหมายและมีประสิทธิภาพมากยิ่งขึ้น ดูคำแนะนำเกี่ยวกับการปรับแต่งด้วย LoRA และ ลองใช้งานเลย! เราตื่นเต้นที่จะได้เห็นสิ่งที่คุณสร้างกับ Gemma

เอกสารประกอบสำหรับนักพัฒนาซอฟต์แวร์นี้ให้ภาพรวมของโมเดล Gemma ที่มีอยู่และคู่มือการพัฒนาสำหรับวิธีการใช้และปรับแต่งโมเดลเหล่านั้นสำหรับแอปพลิเคชันที่เฉพาะเจาะจง

ขนาดและความสามารถของโมเดล

โมเดลของ Gemma มีให้เลือกหลากหลายขนาด คุณจึงสร้างโซลูชัน Generative AI ได้ตามทรัพยากรการประมวลผลที่มีอยู่ ความสามารถที่ต้องการ และตำแหน่งที่จะใช้งาน หากไม่แน่ใจว่าต้องเริ่มต้นตรงไหน ให้ลองใช้ขนาดพารามิเตอร์ 2B เพื่อให้มีข้อกำหนดด้านทรัพยากรต่ำลง และมีความยืดหยุ่นมากขึ้นในการติดตั้งใช้งานโมเดล

ขนาดของพารามิเตอร์ อินพุต เอาต์พุต เวอร์ชันที่ปรับแต่ง แพลตฟอร์มที่ต้องการ
2 พันล้าน ข้อความ ข้อความ
  • ฝึกล่วงหน้า
  • ปรับวิธีการแล้ว
อุปกรณ์เคลื่อนที่และแล็ปท็อป
7 พันล้าน ข้อความ ข้อความ
  • ฝึกล่วงหน้า
  • ปรับวิธีการแล้ว
คอมพิวเตอร์เดสก์ท็อปและเซิร์ฟเวอร์ขนาดเล็ก

หากใช้ฟีเจอร์ที่มีหลายแบ็คเอนด์ของ Keras 3.0 คุณจะเรียกใช้โมเดลเหล่านี้บน TensorFlow, JAX และ PyTorch หรือแม้กระทั่งการนำ JAX ไปใช้แบบเนทีฟ (อิงตามเฟรมเวิร์ก FLAX) และ PyTorch

คุณดาวน์โหลดโมเดล Gemma ได้จากโมเดล Kaggle

โมเดลที่ปรับแต่ง

คุณสามารถแก้ไขพฤติกรรมของโมเดล Gemma ได้ด้วยการฝึกเพิ่มเติม เพื่อให้โมเดลทำงานได้ดีขึ้นสำหรับงานที่เฉพาะเจาะจง กระบวนการนี้เรียกว่าการปรับแต่งโมเดล และแม้เทคนิคนี้จะปรับปรุงความสามารถของโมเดลในการทำงานเป้าหมาย แต่ก็อาจทำให้โมเดลแย่ลงในงานอื่นๆ ด้วย ด้วยเหตุนี้ โมเดลของ Gemma จึงมีให้ใช้ทั้งในเวอร์ชันที่มีการปรับแต่งและการฝึกล่วงหน้า

  • ฝึกล่วงหน้าแล้ว - โมเดลเวอร์ชันเหล่านี้ไม่ได้รับการฝึกในงานหรือวิธีการที่เฉพาะเจาะจงที่นอกเหนือจากชุดการฝึกข้อมูลหลักของ Gemma คุณไม่ควรทำให้โมเดลเหล่านี้ใช้งานได้โดยไม่ได้ปรับแต่งบางอย่าง
  • วิธีการปรับแต่ง - โมเดลเวอร์ชันเหล่านี้ได้รับการฝึกด้วยการโต้ตอบเป็นภาษามนุษย์และตอบสนองต่อการป้อนข้อมูลแบบการสนทนาได้ คล้ายกับแชทบ็อต

เริ่มต้นใช้งาน

ดูคู่มือต่อไปนี้เพื่อเริ่มสร้างโซลูชันกับ Gemma