Rangkaian model terbuka Gemma mencakup berbagai ukuran model, kemampuan, dan variasi khusus tugas untuk membantu Anda membangun solusi generatif kustom. Berikut adalah jalur utama yang dapat Anda ikuti saat menggunakan model Gemma dalam aplikasi:
- Pilih model dan deploy apa adanya di aplikasi Anda
- Pilih model, sesuaikan untuk tugas tertentu, lalu deploy di aplikasi, atau bagikan kepada komunitas.
Panduan ini membantu Anda memulai dengan memilih model, menguji kemampuannya, dan secara opsional, menyesuaikan model yang Anda pilih untuk aplikasi Anda.
Dapatkan di Kaggle Dapatkan di Hugging Face
Pilih model
Bagian ini membantu Anda memahami varian resmi rangkaian model Gemma dan memilih model untuk aplikasi Anda. Varian model menyediakan kemampuan umum atau dikhususkan untuk tugas tertentu, dan disediakan dalam berbagai ukuran parameter sehingga Anda dapat memilih model yang memiliki kemampuan pilihan Anda dan memenuhi persyaratan komputasi Anda.
Tabel berikut mencantumkan varian utama keluarga model Gemma dan platform deployment yang dituju:
Keluarga Gemma 4
Generasi terbaru yang menampilkan input multimodal (teks, gambar, audio).
| Ukuran | Varian | Input ➔ Output | Platform yang Dituju |
|---|---|---|---|
| E2B | Gemma 4 (core) | Teks, gambar, audio ➔ Teks | Perangkat seluler |
| E4B | Gemma 4 (core) | Teks, gambar, audio ➔ Teks | Perangkat seluler dan laptop |
| A4B | Gemma 4 (core) | Teks, gambar ➔ Teks | Komputer desktop dan server kecil |
| 31B | Gemma 4 (core) | Teks, gambar ➔ Teks | Server besar atau cluster server |
Keluarga Gemma 3 & 3n
Model inti untuk pemrosesan teks dan gambar yang skalabel, serta varian '3n' untuk input multimodal yang diperluas.
| Ukuran | Varian | Input ➔ Output | Platform yang Dituju |
|---|---|---|---|
| 270 JT | Gemma 3 (inti) | Teks ➔ Teks | Perangkat seluler dan komputer papan tunggal |
| 1B | Gemma 3 (inti) | Teks ➔ Teks | Perangkat seluler dan komputer papan tunggal |
| E2B | Gemma 3n | Teks, gambar, audio ➔ Teks | Perangkat seluler |
| 4B | Gemma 3 (inti) | Teks, gambar ➔ Teks | Komputer desktop dan server kecil |
| E4B | Gemma 3n | Teks, gambar, audio ➔ Teks | Perangkat seluler dan laptop |
| 12B | Gemma 3 (inti) | Teks, gambar ➔ Teks | Komputer desktop dan server kelas atas |
| 27B | Gemma 3 (inti) | Teks, gambar ➔ Teks | Server besar atau cluster server |
Keluarga Gemma 2
Mencakup model teks standar dan varian bahasa visual multimodal PaliGemma 2.
| Ukuran | Varian | Input ➔ Output | Platform yang Dituju |
|---|---|---|---|
| 2B | Gemma 2 (inti) | Teks ➔ Teks | Perangkat seluler dan laptop |
| 3B | PaliGemma 2 | Teks, gambar ➔ Teks | Komputer desktop dan server kecil |
| 9B | Gemma 2 (inti) | Teks ➔ Teks | Komputer desktop dan server kelas atas |
| 10B | PaliGemma 2 | Teks, gambar ➔ Teks | Komputer desktop dan server kelas atas |
| 27B | Gemma 2 (inti) | Teks ➔ Teks | Server besar atau cluster server |
| 28B | PaliGemma 2 | Teks, gambar ➔ Teks | Server besar atau cluster server |
Gemma 1 Family
Generasi asli, termasuk varian khusus coding.
| Ukuran | Varian | Input ➔ Output | Platform yang Dituju |
|---|---|---|---|
| 2B | Gemma (inti) CodeGemma |
Teks ➔ Teks | Perangkat seluler dan laptop |
| 7B | Gemma (inti) CodeGemma |
Teks ➔ Teks | Komputer desktop dan server kecil |
Kumpulan model Gemma juga mencakup model khusus dan model riset, termasuk ShieldGemma, DataGemma, Gemma Scope, dan Gemma-APS.
Model pengujian
Anda dapat menguji model Gemma dengan menyiapkan lingkungan pengembangan dengan model yang didownload dan software pendukung. Kemudian, Anda dapat memberikan perintah kepada model dan mengevaluasi responsnya. Gunakan salah satu notebook Python berikut dengan framework machine learning pilihan Anda untuk menyiapkan lingkungan pengujian dan meminta model Gemma:
Menyesuaikan model
Anda dapat mengubah perilaku model Gemma dengan melakukan penyesuaian pada model tersebut. Penyesuaian model memerlukan set data input dan respons yang diharapkan dengan ukuran dan variasi yang memadai untuk memandu perilaku model. Anda juga memerlukan resource komputasi dan memori yang jauh lebih besar untuk menyelesaikan sesi penyesuaian dibandingkan dengan menjalankan model Gemma untuk pembuatan teks. Gunakan salah satu notebook Python berikut untuk menyiapkan lingkungan pengembangan penyesuaian dan menyesuaikan model Gemma:
- Menyesuaikan Gemma dengan Keras dan penyesuaian LoRA
- Menyesuaikan model Gemma yang lebih besar dengan pelatihan terdistribusi
Langkah Berikutnya
Lihat panduan berikut untuk membangun lebih banyak solusi dengan Gemma: