Model terbuka Gemma
Rangkaian model terbuka yang ringan dan canggih, dibangun dari riset dan teknologi yang sama dengan yang digunakan untuk membuat model Gemini
Bertanggung jawab secara desain
Dengan menggabungkan langkah-langkah keamanan yang komprehensif, model ini membantu memastikan solusi AI yang bertanggung jawab dan tepercaya melalui set data pilihan dan penyesuaian yang ketat.
Performa yang tidak tertandingi dalam ukuran
Model Gemma mencapai hasil tolok ukur yang luar biasa pada ukuran 2B dan 7B, bahkan mengungguli beberapa model terbuka yang lebih besar.
Framework fleksibel
Dengan Keras 3.0, nikmati kompatibilitas yang lancar dengan JAX, TensorFlow, dan PyTorch, sehingga Anda bisa dengan mudah memilih dan beralih framework, bergantung pada tugas Anda.
Varian model Gemma
Panduan memulai cepat untuk developer
Panduan memulai cepat partner
Tolok ukur
Gemma menetapkan standar baru untuk performa ukuran yang termutakhir dibandingkan model populer seperti Llama 2 dan Mistral 7B.
5 pukulan, 1 terbaik
MMLU
Tolok ukur MMLU adalah pengujian yang mengukur luasnya pengetahuan dan kemampuan memecahkan masalah yang diperoleh oleh model bahasa besar selama prapelatihan.
0 kali
HellaSwag
Tolok ukur HellaSwag menantang kemampuan model bahasa untuk memahami dan menerapkan penalaran akal sehat dengan memilih akhir cerita yang paling logis.
0 kali
PIQA
Tolok ukur PIQA menguji kemampuan model bahasa untuk memahami dan menerapkan pengetahuan umum fisik dengan menjawab pertanyaan tentang interaksi fisik sehari-hari.
0 kali
SIQA
Tolok ukur SIQA mengevaluasi pemahaman model bahasa tentang interaksi sosial dan akal sehat sosial dengan mengajukan pertanyaan tentang tindakan orang dan implikasi sosialnya.
0 kali
Boolq
Tolok ukur BoolQ menguji kemampuan model bahasa untuk menjawab pertanyaan ya/tidak yang terjadi secara alami (dibuat dalam setelan yang tidak diminta dan tidak terbatas), menguji kemampuan model untuk melakukan tugas inferensi natural language di dunia nyata.
penskoran parsial
Winogrande
Tolok ukur Winogrande menguji kemampuan model bahasa untuk menyelesaikan tugas yang ambigu dengan opsi biner, yang membutuhkan penalaran umum umum.
7 tembakan
CQA
Tolok ukur CQA menilai kinerja model bahasa pada jawaban pertanyaan pilihan ganda, yang membutuhkan berbagai jenis pengetahuan umum.
OBQA
Tolok ukur OBQA mengevaluasi kemampuan model bahasa untuk melakukan jawaban pertanyaan tingkat lanjut dengan penalaran multi-langkah, pengetahuan umum, dan pemahaman rich text, yang dimodelkan berdasarkan ujian buku terbuka.
ARC
Tolok ukur ARC-e menguji keterampilan menjawab pertanyaan tingkat lanjut model bahasa dengan pertanyaan sains pilihan ganda tingkat sekolah dasar yang sesungguhnya.
ARC-c
Tolok ukur ARC-c adalah subset set data ARC-e yang lebih terfokus, yang hanya berisi pertanyaan yang tidak dijawab dengan benar oleh algoritma umum (retrieval-base dan word co-when).
5 tembakan
TriviaQA
Tolok ukur TriviaQA menguji kemampuan pemahaman membaca dengan tiga kali lipat bukti tanya jawab.
lulus@1
HumanEval
Tolok ukur HumanEval menguji kemampuan pembuatan kode model bahasa dengan mengevaluasi apakah solusinya lulus pengujian unit fungsional untuk masalah pemrograman.
3 tembakan
MBPP
Tolok ukur MBPP menguji kemampuan model bahasa untuk memecahkan masalah pemrograman Python dasar, dengan berfokus pada konsep pemrograman dasar dan penggunaan library standar.
maj@1
GSM8K
Tolok ukur GSM8K menguji kemampuan model bahasa untuk memecahkan soal matematika tingkat sekolah dasar yang sering kali memerlukan beberapa langkah penalaran.
4 tembakan
MATH
Tolok ukur MATH mengevaluasi kemampuan model bahasa untuk memecahkan soal cerita matematika yang kompleks, membutuhkan penalaran, pemecahan masalah multilangkah, dan pemahaman konsep matematika.
AGIEval
Tolok ukur AGIEval menguji kecerdasan umum model bahasa dengan menggunakan pertanyaan dari ujian dunia nyata yang dirancang untuk menilai kemampuan intelektual manusia (ujian masuk perguruan tinggi, ujian hukum, dll.).
BBH
Tolok ukur BBH (BIG-Bench Hard) berfokus pada tugas-tugas yang dianggap di luar kemampuan model bahasa saat ini, dengan menguji batas kemampuan di berbagai bidang penalaran dan pemahaman.
100%
75%
50%
25%
0%
100%
75%
50%
25%
0%
Gemma
7 miliar
Gemma
2 miliar
Mistral
7 miliar
LLAMA-2
13b
LLAMA-2
7 miliar
Gemma
7 miliar
Gemma
2 miliar
Mistral
7 miliar
LLAMA-2
13b
LLAMA-2
7 miliar
Gemma
7 miliar
Gemma
2 miliar
Mistral
7 miliar
LLAMA-2
13b
LLAMA-2
7 miliar
Gemma
7 miliar
Gemma
2 miliar
Mistral
7 miliar
LLAMA-2
13b
LLAMA-2
7 miliar
Gemma
7 miliar
Gemma
2 miliar
Mistral
7 miliar
LLAMA-2
13b
LLAMA-2
7 miliar
Gemma
7 miliar
Gemma
2 miliar
Mistral
7 miliar
LLAMA-2
13b
LLAMA-2
7 miliar
Gemma
7 miliar
Gemma
2 miliar
Mistral
7 miliar
LLAMA-2
13b
LLAMA-2
7 miliar
Gemma
7 miliar
Gemma
2 miliar
Mistral
7 miliar
LLAMA-2
13b
LLAMA-2
7 miliar
Gemma
7 miliar
Gemma
2 miliar
Mistral
7 miliar
LLAMA-2
13b
LLAMA-2
7 miliar
Gemma
7 miliar
Gemma
2 miliar
Mistral
7 miliar
LLAMA-2
13b
LLAMA-2
7 miliar
Gemma
7 miliar
Gemma
2 miliar
Mistral
7 miliar
LLAMA-2
13b
LLAMA-2
7 miliar
Gemma
7 miliar
Gemma
2 miliar
Mistral
7 miliar
LLAMA-2
13b
LLAMA-2
7 miliar
Gemma
7 miliar
Gemma
2 miliar
Mistral
7 miliar
LLAMA-2
13b
LLAMA-2
7 miliar
Gemma
7 miliar
Gemma
2 miliar
Mistral
7 miliar
LLAMA-2
13b
LLAMA-2
7 miliar
Gemma
7 miliar
Gemma
2 miliar
Mistral
7 miliar
LLAMA-2
13b
LLAMA-2
7 miliar
Gemma
7 miliar
Gemma
2 miliar
Mistral
7 miliar
LLAMA-2
13b
LLAMA-2
7 miliar
Gemma
7 miliar
Gemma
2 miliar
Mistral
7 miliar
LLAMA-2
13b
LLAMA-2
7 miliar
*Lihat laporan teknis untuk detail tentang performa dengan metodologi lain
Akses Gemma sekarang
Model Gemma tersedia di semua hub model favorit Anda.
Pengembangan responsible AI
Tanggung Jawab berdasarkan Desain
Berlatih dengan data yang diseleksi dengan cermat dan mengutamakan keamanan, sehingga membantu mendukung pengembangan AI yang aman dan bertanggung jawab berdasarkan model Gemma.
Evaluasi yang Andal dan Transparan
Evaluasi komprehensif dan pelaporan yang transparan mengungkap batasan model untuk menerapkan pendekatan yang bertanggung jawab untuk setiap kasus penggunaan.
Mendukung Pengembangan yang Bertanggung Jawab
Responsible Generative AI Toolkit mendukung developer untuk mendesain dan menerapkan praktik terbaik Responsible AI.
Dioptimalkan untuk Google Cloud
Dengan model Gemma di Google Cloud, Anda dapat menyesuaikan model secara mendalam dengan kebutuhan spesifik Anda menggunakan alat Vertex AI yang terkelola sepenuhnya atau opsi GKE yang dikelola sendiri, serta men-deploy-nya ke infrastruktur yang fleksibel dan hemat biaya dengan AI.
Mempercepat penelitian akademik dengan kredit Google Cloud
Academic Research Program baru-baru ini telah mengakhiri periode penerapannya, dan memberikan kredit Google Cloud untuk mendukung para peneliti yang berhasil menembus batas penemuan ilmiah menggunakan model Gemma. Kami tidak sabar untuk melihat penelitian inovatif yang muncul dari inisiatif ini.
Bergabunglah dengan komunitas
Terhubung, jelajahi, dan bagikan pengetahuan Anda dengan orang lain dalam komunitas model ML.