Ringkasan model Gemma

Gemma adalah kelompok model terbuka yang ringan dan canggih yang dibangun dari riset dan teknologi yang sama dengan yang digunakan untuk membuat model Gemini. Dikembangkan oleh Google DeepMind dan tim lain di Google, Gemma dinamai berdasarkan gemma dalam bahasa Latin, yang berarti "batu mulia". Bobot model Gemma didukung oleh alat developer yang mendorong inovasi, kolaborasi, dan penggunaan kecerdasan buatan (AI) yang bertanggung jawab.

Model Gemma tersedia untuk dijalankan di aplikasi Anda dan di hardware, perangkat seluler, atau layanan yang dihosting. Anda juga dapat menyesuaikan model ini menggunakan teknik penyesuaian agar unggul dalam melakukan tugas yang penting bagi Anda dan pengguna. Model Gemma mengambil inspirasi dan silsilah teknologi dari kelompok model Gemini, serta dibuat untuk komunitas pengembangan AI agar dapat memperluas dan melangkah lebih jauh.

Anda dapat menggunakan model Gemma untuk pembuatan teks, tetapi juga dapat menyesuaikan model ini untuk memiliki spesialisasi dalam melakukan tugas tertentu. Model Gemma yang disesuaikan dapat memberi Anda dan pengguna solusi AI generatif yang lebih bertarget dan efisien. Lihat panduan kami tentang tuning dengan LoRA dan cobalah. Kami ingin segera melihat apa yang bisa Anda bangun dengan Gemma.

Dokumentasi developer ini memberikan ringkasan tentang model Gemma yang tersedia dan panduan pengembangan tentang cara menerapkannya dan menyesuaikannya untuk aplikasi tertentu.

Ukuran dan kemampuan model

Model Gemma tersedia dalam beberapa ukuran sehingga Anda dapat membangun solusi AI generatif berdasarkan resource komputasi yang tersedia, kemampuan yang Anda butuhkan, dan tempat Anda ingin menjalankannya. Jika Anda tidak yakin harus memulai dari mana, coba ukuran parameter 2B untuk persyaratan resource yang lebih rendah dan fleksibilitas yang lebih besar untuk men-deploy model.

Ukuran parameter Input Output Versi yang disesuaikan Platform yang ditargetkan
2 M Teks Teks
  • Model terlatih
  • Petunjuk telah disesuaikan
Perangkat seluler dan laptop
7 M Teks Teks
  • Model terlatih
  • Petunjuk telah disesuaikan
Komputer desktop dan server kecil

Dengan menggunakan fitur multi-yang didukung Keras 3.0, Anda dapat menjalankan model ini di TensorFlow, JAX, dan PyTorch, atau bahkan menggunakan implementasi native JAX (berdasarkan framework FLAX) dan PyTorch.

Anda dapat mendownload model Gemma dari Model Kaggle.

Model yang disesuaikan

Anda dapat memodifikasi perilaku model Gemma dengan pelatihan tambahan sehingga model berperforma lebih baik pada tugas tertentu. Proses ini disebut penyesuaian model, dan meskipun teknik ini meningkatkan kemampuan model untuk melakukan tugas yang ditargetkan, teknik ini juga dapat menyebabkan kondisi model menjadi lebih buruk pada tugas lainnya. Oleh karena itu, model Gemma tersedia dalam versi petunjuk yang disesuaikan dan versi terlatih:

  • Berlatih - Versi model ini tidak dilatih pada tugas atau petunjuk tertentu di luar set pelatihan data inti Gemma. Anda tidak boleh men-deploy model ini tanpa melakukan beberapa penyesuaian.
  • Petunjuk disesuaikan - Versi model ini dilatih dengan interaksi bahasa manusia dan dapat merespons input percakapan, mirip dengan bot chat.

Memulai

Lihat panduan ini untuk mulai membuat solusi dengan Gemma: