Lihat repositori Gemma Cookbook untuk mengetahui contoh pembuatan dan penyesuaian. Pelajari lebih lanjut

Halaman ini diterjemahkan oleh Cloud Translation API.

Model Terbuka Gemma

Serangkaian model open source yang ringan dan canggih, yang dibuat dari riset dan teknologi yang sama dengan yang digunakan untuk membuat model Gemini

Mulai

Bertanggung jawab dari desain

Dengan menerapkan langkah-langkah keamanan yang komprehensif, model ini membantu memastikan solusi AI yang bertanggung jawab dan tepercaya melalui set data yang diseleksi dan penyesuaian yang ketat.

Performa yang tidak tertandingi dalam ukuran

Model Gemma mencapai hasil benchmark yang luar biasa pada ukuran 2 M, 7 M, 9 M, dan 27 M, bahkan mengungguli beberapa model terbuka yang lebih besar.

Framework fleksibel

Dengan Keras 3.0, nikmati kompatibilitas yang lancar dengan JAX, TensorFlow, dan PyTorch, yang memungkinkan Anda memilih dan beralih framework dengan mudah, bergantung pada tugas Anda.

Memperkenalkan
Gemma 2

Didesain ulang untuk performa luar biasa dan efisiensi yang tak tertandingi, Gemma 2 mengoptimalkan inferensi super cepat pada beragam hardware.

Coba Gemma 2 di Google AI Studio

5 tembakan

MMLU

Tolok ukur MMLU adalah pengujian yang mengukur cakupan pengetahuan dan kemampuan pemecahan masalah yang diperoleh oleh model bahasa besar selama prapelatihan.

25 shot

ARC-C

Benchmark ARC-c adalah subset yang lebih terfokus dari set data ARC-e, yang hanya berisi pertanyaan yang salah dijawab oleh algoritma umum (ko-kejadian kata dan berbasis pengambilan).

5-shot

GSM8K

Tolok ukur GSM8K menguji kemampuan model bahasa untuk memecahkan soal matematika tingkat sekolah dasar yang sering kali memerlukan beberapa langkah penalaran.

3-5 tembakan

AGIEval

Tolok ukur AGIEval menguji kecerdasan umum model bahasa dengan menggunakan pertanyaan dari ujian dunia nyata yang dirancang untuk menilai kemampuan intelektual manusia.

3-shot, CoT

BBH

Tolok ukur BBH (BIG-Bench Hard) berfokus pada tugas-tugas yang dianggap di luar kemampuan model bahasa saat ini, dengan menguji batas kemampuan di berbagai bidang penalaran dan pemahaman.

3-shot, F1

LEPASKAN

DROP adalah benchmark pemahaman membaca yang memerlukan penalaran terpisah atas paragraf.

5-shot

Winogrande

Benchmark Winogrande menguji kemampuan model bahasa untuk menyelesaikan tugas mengisi titik-titik yang ambigu dengan opsi biner, yang memerlukan penalaran akal sehat umum.

10 kali

HellaSwag

Tolok ukur HellaSwag menantang kemampuan model bahasa untuk memahami dan menerapkan penalaran akal sehat dengan memilih akhir cerita yang paling logis.

4-shot

MATH

MATH mengevaluasi kemampuan model bahasa untuk menyelesaikan soal cerita matematika yang kompleks, yang memerlukan penalaran, pemecahan masalah multilangkah, dan pemahaman konsep matematika.

0-shot

ARC-e

Benchmark ARC-e menguji keterampilan menjawab pertanyaan lanjutan model bahasa dengan pertanyaan sains pilihan ganda tingkat sekolah dasar yang asli.

0-shot

PIQA

Benchmark PIQA menguji kemampuan model bahasa untuk memahami dan menerapkan pengetahuan umum fisik dengan menjawab pertanyaan tentang interaksi fisik sehari-hari.

0-shot

SIQA

Tolok ukur SIQA mengevaluasi pemahaman model bahasa tentang interaksi sosial dan akal sehat sosial dengan mengajukan pertanyaan tentang tindakan orang dan implikasi sosialnya.

0 kali

Boolq

Benchmark BoolQ menguji kemampuan model bahasa untuk menjawab pertanyaan ya/tidak yang muncul secara alami, menguji kemampuan model untuk melakukan tugas inferensi bahasa alami di dunia nyata.

5 tembakan

TriviaQA

Tolok ukur TriviaQA menguji keterampilan pemahaman membaca dengan tiga pertanyaan-jawaban-bukti.

5 tembakan

Tolok ukur NQ (Natural Questions) menguji kemampuan model bahasa untuk menemukan dan memahami jawaban di seluruh artikel Wikipedia, yang menyimulasikan skenario tanya jawab di dunia nyata.

pass@1

HumanEval

Benchmark HumanEval menguji kemampuan pembuatan kode model bahasa dengan mengevaluasi apakah solusinya lulus pengujian unit fungsional untuk masalah pemrograman.

3-shot

MBPP

Benchmark MBPP menguji kemampuan model bahasa untuk menyelesaikan masalah pemrograman Python dasar, dengan berfokus pada konsep pemrograman dasar dan penggunaan library standar.

100%

75%

50%

25%

100%

75%

50%

25%

Gemma 1

2,5 M

42,3

Gemma 2

2,6 miliar

51,3

Mistral

62,5

LLAMA 3

66,6

Gemma 1

64,4

Gemma 2

9 miliar

71,3

Gemma 2

27B

75,2

Gemma 1

2,5 M

48,5

Gemma 2

2,6 miliar

55,4

Mistral

60.5

LLAMA 3

59,2

Gemma 1

61,1

Gemma 2

9 miliar

68,4

Gemma 2

27B

71,4

Gemma 1

2,5 M

15.1

Gemma 2

2,6 miliar

23,9

Mistral

39,6

LLAMA 3

45,7

Gemma 1

51,8

Gemma 2

9 miliar

68,6

Gemma 2

27B

74,0

Gemma 1

2,5 M

24,2

Gemma 2

2,6 miliar

30.6

Mistral

44,0

LLAMA 3

45,9

Gemma 1

7 M

44,9

Gemma 2

9 miliar

52,8

Gemma 2

27B

55.1

Gemma 1

2,5 M

35,2

Gemma 2

2,6 miliar

41,9

Mistral

7 M

56,0

LLAMA 3

61,1

Gemma 1

7 M

59,0

Gemma 2

9 miliar

68.2

Gemma 2

27B

74,9

Gemma 1

2,5 M

48,5

Gemma 2

2,6 miliar

52,0

Mistral

63,8

LLAMA 3

58,4

Gemma 1

56,3

Gemma 2

9 miliar

69,4

Gemma 2

27B

74,2

Gemma 1

2,5 M

66,8

Gemma 2

2,6 miliar

70,9

Mistral

78,5

LLAMA 3

76,1

Gemma 1

79,0

Gemma 2

9 miliar

80,6

Gemma 2

27 M

83,7

Gemma 1

2,5 M

71,7

Gemma 2

2,6 miliar

73,0

Mistral

83,0

LLAMA 3

82,0

Gemma 1

82,3

Gemma 2

9 miliar

81,9

Gemma 2

27 M

86,4

Gemma 1

2,5 M

11.8

Gemma 2

2,6 miliar

15,0

Mistral

12,7

Gemma 1

7 M

24,3

Gemma 2

9 miliar

36,6

Gemma 2

27B

42,3

Gemma 1

2,5 M

73,2

Gemma 2

2,6 miliar

80,1

Mistral

7 M

80,5

Gemma 1

81,5

Gemma 2

9 miliar

88,0

Gemma 2

27B

88,6

Gemma 1

2,5 M

77,3

Gemma 2

2,6 miliar

77,8

Mistral

7 M

82,2

Gemma 1

81,2

Gemma 2

9 miliar

81,7

Gemma 2

27 M

83,2

Gemma 1

2,5 M

49,7

Gemma 2

2,6 miliar

51,9

Mistral

7 M

47,0

Gemma 1

51,8

Gemma 2

9 miliar

53,4

Gemma 2

27 M

53,7

Gemma 1

2,5 M

69,4

Gemma 2

2,6 miliar

72,5

Mistral

83,2

Gemma 1

83,2

Gemma 2

9 miliar

84,2

Gemma 2

27 M

84,8

Gemma 1

2,5 M

53,2

Gemma 2

2,6 miliar

59,4

Mistral

62,5

Gemma 1

7 M

63,4

Gemma 2

9 miliar

76,6

Gemma 2

27 M

83,7

Gemma 1

2,5 M

12,5

Gemma 2

2,6 miliar

16,7

Mistral

23,2

Gemma 1

23,0

Gemma 2

9 miliar

29,2

Gemma 2

27B

34,5

Gemma 1

2,5 M

22,0

Gemma 2

2,6 miliar

17,7

Mistral

26,2

Gemma 1

7 M

32.3

Gemma 2

9 miliar

40,2

Gemma 2

27B

51,8

Gemma 1

2,5 M

29,2

Gemma 2

2,6 miliar

29,6

Mistral

40,2

Gemma 1

44,4

Gemma 2

9 miliar

52,4

Gemma 2

27B

62,6

*Ini adalah tolok ukur untuk model terlatih sebelumnya. Lihat laporan teknis untuk mengetahui detail performa dengan metodologi lainnya.

Baca laporan teknis

Rangkaian model Gemma

Rilis baru

Gemma 2

Gemma 2 menawarkan tiga model baru yang canggih dan efisien yang tersedia dalam ukuran parameter 2, 9, dan 27 miliar, semuanya dengan peningkatan keamanan bawaan.

Memulai Hugging Face Memulai Kaggle

Rilis baru

DataGemma

DataGemma adalah model terbuka pertama yang dirancang untuk menghubungkan LLM dengan data dunia nyata yang luas yang diambil dari Data Commons Google.

Mulai di Kaggle

Gemma 1

Model Gemma adalah model bahasa besar ringan, teks-ke-teks, khusus decoder, yang dilatih pada set data besar yang berisi teks, kode, dan konten matematika untuk berbagai tugas pemrosesan bahasa alami.

Mulai di Kaggle

RecurrentGemma

RecurrentGemma adalah model yang secara teknis berbeda yang memanfaatkan jaringan saraf berulang dan perhatian lokal untuk meningkatkan efisiensi memori.

Mulai di Kaggle

PaliGemma

PaliGemma adalah model bahasa visual terbuka yang terinspirasi oleh PaLI-3, yang memanfaatkan SigLIP dan Gemma, yang dirancang sebagai model serbaguna untuk ditransfer ke berbagai tugas bahasa visual.

Mulai di Kaggle

CodeGemma

Dengan memanfaatkan fondasi model Gemma asli yang telah dilatih sebelumnya, CodeGemma menghadirkan kemampuan penyelesaian dan pembuatan kode yang canggih dalam ukuran yang sesuai untuk komputer lokal Anda.

Mulai menggunakan Kaggle

Pelajari alat kami

ShieldGemma

ShieldGemma adalah serangkaian model pengklasifikasi konten keamanan yang dibuat berdasarkan Gemma 2 untuk memfilter input dan output model AI serta menjaga keamanan pengguna.

Cakupan Gemma

Gemma Scope menawarkan transparansi yang belum pernah ada sebelumnya kepada peneliti tentang proses pengambilan keputusan model Gemma 2 kami.

Panduan memulai cepat untuk developer

Temukan panduan memulai di Kaggle

Buka halaman Model Kaggle untuk menemukan panduan memulai, contoh kode, dan diskusi untuk Gemma.

Buka di Kaggle

Melatih dan men-deploy di Google Cloud

Gemma 2 berfungsi paling baik di Google Cloud, dengan pengoptimalan TPU menyeluruh untuk performa terbaik di pasar dan total biaya kepemilikan di Vertex.

Buka di Vertex AI

Coba adaptasi peringkat rendah dengan JAX melalui Keras 3

Sesuaikan model Gemma dengan domain dan data unik Anda dengan framework backend pilihan Anda melalui Keras 3.

Buka di Colab

Lihat semua panduan memulai dalam dokumentasi kami Lihat semua panduan memulai

Panduan memulai cepat untuk partner

Wajah Memeluk

Manfaatkan Hugging Face Transformers dan TRL untuk tugas fine-tuning dan inferensi dengan model Gemma.

NVIDIA

Sempurnakan model Gemma dengan NVIDIA NeMo Framework dan ekspor ke TensorRT-LLM untuk produksi.

LangChain

Tutorial ini menunjukkan cara memulai Gemma dan LangChain, yang berjalan di Google Cloud atau di lingkungan Colab Anda.

Anyscale

Dokumen ini menunjukkan cara menggunakan Gemma melalui Endpoint Anyscale sebagai endpoint API yang dikelola sepenuhnya.

MongoDB

Artikel ini menyajikan cara memanfaatkan Gemma sebagai model dasar dalam pipeline atau sistem pembangkitan yang ditingkatkan yang ditingkatkan.

Weights and Biases

Pelajari lebih lanjut alat Registry Model dan Peluncuran W&B melalui contoh langkah demi langkah menggunakan model Gemma Google.

Buku Resep Gemma

Jelajahi kumpulan resep dan contoh praktis yang menunjukkan keandalan dan fleksibilitas Gemma untuk tugas seperti pemberian teks pada gambar dengan PaliGemma, pembuatan kode dengan CodeGemma, dan pembuatan chatbot dengan model Gemma yang telah disesuaikan.

Mulai memasak

Akses model Gemma sekarang

Model Kaggle

Mengakses model Gemma 2 di Kaggle

Vertex AI Model Garden

Menyesuaikan Gemma 2 dengan data Anda sendiri

Model Hugging Face

Mengakses, menyesuaikan, dan men-deploy Gemma

Pengembangan Responsible AI

Tanggung Jawab dari Desain

Dilatih sebelumnya dengan data yang diseleksi dengan cermat dan disesuaikan untuk keamanan, membantu mendukung pengembangan AI yang aman dan bertanggung jawab berdasarkan model Gemma.

Evaluasi yang Andal dan Transparan

Evaluasi yang komprehensif dan pelaporan yang transparan mengungkap batasan model untuk mengadopsi pendekatan yang bertanggung jawab untuk setiap kasus penggunaan.

Mendukung Pengembangan yang Bertanggung Jawab

Toolkit Responsible Generative AI mendukung developer untuk mendesain dan menerapkan praktik terbaik Responsible AI.

Jelajahi Toolkit AI Generatif yang Bertanggung Jawab

Dioptimalkan untuk Google Cloud

Dengan model Gemma di Google Cloud, Anda dapat menyesuaikan model secara mendalam sesuai kebutuhan spesifik Anda dengan alat yang dikelola sepenuhnya oleh Vertex AI atau opsi pengelolaan mandiri GKE, lalu men-deploynya ke infrastruktur yang dioptimalkan untuk AI yang fleksibel dan hemat biaya.

Pelajari lebih lanjut di blog Google Cloud

Mempercepat riset akademik dengan kredit Google Cloud

Program Riset Akademik baru-baru ini mengakhiri periode pengajuan permohonannya, dengan memberikan kredit Google Cloud untuk mendukung peneliti yang mendorong batasan penemuan ilmiah menggunakan model Gemma. Kami tidak sabar untuk melihat riset inovatif yang muncul dari inisiatif ini.

Nantikan peluang mendatang untuk meningkatkan riset Anda dengan Google Cloud.

Gabung dengan komunitas

Terhubung, jelajahi, dan bagikan pengetahuan Anda dengan orang lain dalam komunitas model ML.

Model Terbuka Gemma

Bertanggung jawab dari desain

Performa yang tidak tertandingi dalam ukuran

Framework fleksibel

Memperkenalkan
Gemma 2

Rangkaian model Gemma

Gemma 2

DataGemma

Gemma 1

RecurrentGemma

PaliGemma

CodeGemma

Pelajari alat kami

Panduan memulai cepat untuk developer

Temukan panduan memulai di Kaggle

Melatih dan men-deploy di Google Cloud

Coba adaptasi peringkat rendah dengan JAX melalui Keras 3

Panduan memulai cepat untuk partner

Buku Resep Gemma

Akses model Gemma sekarang

Pengembangan Responsible AI

Dioptimalkan untuk Google Cloud

Mempercepat riset akademik dengan kredit Google Cloud

Gabung dengan komunitas

Kaggle

Discord

Blog

Model Terbuka Gemma

Bertanggung jawab dari desain

Performa yang tidak tertandingi dalam ukuran

Framework fleksibel

Memperkenalkan Gemma 2

Rangkaian model Gemma

Gemma 2

DataGemma

Gemma 1

RecurrentGemma

PaliGemma

CodeGemma

Pelajari alat kami

Panduan memulai cepat untuk developer

Temukan panduan memulai di Kaggle

Melatih dan men-deploy di Google Cloud

Coba adaptasi peringkat rendah dengan JAX melalui Keras 3

Panduan memulai cepat untuk partner

Buku Resep Gemma

Akses model Gemma sekarang

Pengembangan Responsible AI

Dioptimalkan untuk Google Cloud

Mempercepat riset akademik dengan kredit Google Cloud

Gabung dengan komunitas

Kaggle

Discord

Blog

Memperkenalkan
Gemma 2