Halaman ini diterjemahkan oleh Cloud Translation API.

Model terbuka Gemma

Rangkaian model terbuka yang ringan dan canggih, dibuat dari riset dan teknologi yang sama dengan yang digunakan untuk membuat model Gemini

Mulai

Bertanggung jawab dari desain

Dengan mengintegrasikan langkah-langkah keamanan yang komprehensif, model ini membantu memastikan solusi AI yang bertanggung jawab dan tepercaya melalui set data pilihan dan penyesuaian yang ketat.

Performa yang tidak tertandingi dalam ukuran

Model Gemma mencapai hasil benchmark yang luar biasa pada ukuran 2B dan 7B, bahkan mengungguli beberapa model terbuka yang lebih besar.

Framework fleksibel

Dengan Keras 3.0, nikmati kompatibilitas tanpa batas dengan JAX, TensorFlow, dan PyTorch, sehingga Anda dapat dengan mudah memilih dan mengganti framework bergantung pada tugas Anda.

Varian model Gemma

Gemma

Model Gemma adalah model bahasa besar yang ringan, teks-ke-teks, dan khusus decoder, yang dilatih dengan set data besar yang berisi teks, kode, dan konten matematika untuk berbagai tugas natural language processing.

Mulai

CodeGemma

Dengan memanfaatkan fondasi model Gemma terlatih kami yang asli, CodeGemma menghadirkan penyelesaian kode dan kemampuan pembuatan yang canggih dalam ukuran yang sesuai untuk komputer lokal Anda.

Mulai

PaliGemma

PaliGemma adalah model bahasa visi terbuka yang didesain untuk penyempurnaan performa terdepan di kelasnya pada berbagai tugas bahasa visual.

Mulai

RecurrentGemma

RecurrentGemma adalah model berbeda secara teknis yang memanfaatkan jaringan saraf berulang dan perhatian lokal untuk meningkatkan efisiensi memori.

Mulai

Panduan memulai untuk developer

Temukan panduan memulai di Kaggle

Kunjungi halaman Model Kaggle untuk menemukan panduan memulai, contoh kode, dan diskusi untuk Gemma.

Buka di Kaggle

Latih dan deploy di Google Cloud

Gemma berfungsi optimal di Google Cloud, dengan pengoptimalan TPU menyeluruh untuk performa terdepan di pasar dan total biaya kepemilikan di Vertex.

Buka di Vertex AI

Coba adaptasi peringkat rendah dengan JAX via Keras 3

Sesuaikan model Gemma ke domain dan data unik Anda dengan framework backend pilihan Anda melalui Keras 3.

Buka di Colab

Lihat semua panduan memulai di dokumentasi kamiLihat semua panduan memulai

Panduan memulai cepat partner

Wajah Memeluk

Manfaatkan Transformer Wajah Peluk dan TRL untuk tugas penyempurnaan dan inferensi dengan model Gemma.

Lihat di Wajah Memeluk

NVIDIA

Tingkatkan kualitas model Gemma dengan NVIDIA NeMo Framework dan ekspor ke TensorRT-LLM untuk diproduksi.

Lihat di GitHub

LangChain

Tutorial ini menunjukkan cara mulai menggunakan Gemma dan LangChain, yang berjalan di Google Cloud atau di lingkungan Colab Anda.

Buka di Colab

Semua skala

Dokumen ini menunjukkan cara menggunakan Gemma melalui Endpoint Anyscale sebagai endpoint API yang terkelola sepenuhnya.

Lihat di Anyscale

MongoDB

Artikel ini menyajikan cara memanfaatkan Gemma sebagai model dasar dalam sistem atau pipeline pembuatan yang dikaitkan dengan pengambilan.

Lihat di MongoDB

Bobot dan Bias

Pelajari lebih dalam Registry Model dan alat Peluncuran W&B melalui contoh langkah demi langkah menggunakan model Gemma Google.

Lihat tentang Berat dan Bias

Tolok ukur

Gemma menetapkan standar baru untuk performa canggih dalam hal ukuran dibandingkan dengan model populer seperti Llama 2 dan Mistral 7B.

5-tembakan, top-1

MMLU

Tolok ukur MMLU adalah pengujian yang mengukur luasnya pengetahuan dan kemampuan pemecahan masalah yang diperoleh oleh model bahasa besar selama prapelatihan.

Pukulan0

HellaSwag

Tolok ukur HellaSwag menantang kemampuan model bahasa untuk memahami dan menerapkan penalaran akal sehat dengan memilih akhir yang paling logis dari sebuah cerita.

Pukulan0

{i>PIQA<i}

Tolok ukur PIQA menguji kemampuan model bahasa dalam memahami dan menerapkan pengetahuan umum fisik dengan menjawab pertanyaan tentang interaksi fisik sehari-hari.

Pukulan0

SIQA

Tolok ukur SIQA mengevaluasi pemahaman model bahasa tentang interaksi sosial dan akal sehat sosial dengan mengajukan pertanyaan tentang tindakan orang dan implikasi sosial mereka.

Pukulan0

Bool

Tolok ukur BoolQ menguji kemampuan model bahasa untuk menjawab pertanyaan ya/tidak yang terjadi secara alami (yang dihasilkan secara spontan dan tidak terbatas) dan menguji kemampuan model untuk melakukan tugas inferensi natural language di dunia nyata.

skor parsial

Winogrande

Benchmark Winogrande menguji kemampuan model bahasa untuk menyelesaikan tugas pengisian yang ambigu dengan opsi biner, yang memerlukan penalaran umum yang umum.

7 tembakan

CQA

Tolok ukur CQA menilai performa model bahasa pada jawaban pertanyaan pilihan ganda, yang memerlukan jenis pengetahuan umum yang berbeda.

OBQA

Tolok ukur OBQA mengevaluasi kemampuan model bahasa untuk melakukan tanya jawab lanjutan dengan penalaran multi-langkah, pengetahuan umum, dan pemahaman rich text, yang dimodelkan setelah ujian buku terbuka.

ARC-e

Tolok ukur ARC-e menguji kemampuan menjawab pertanyaan tingkat lanjut model bahasa dengan pertanyaan sains pilihan ganda tingkat sekolah dasar.

ARC-c

Tolok ukur ARC-c adalah subset yang lebih terfokus dari set data ARC-e, yang hanya berisi pertanyaan yang tidak dijawab dengan benar oleh algoritma umum (dasar pengambilan dan kemunculan bersama).

5 tembakan

TriviaQA

Tolok ukur TriviaQA menguji keterampilan pemahaman bacaan dengan tiga kali lipat bukti tanya jawab.

sandi@1

HumanEval

Benchmark HumanEval menguji kemampuan pembuatan kode model bahasa dengan mengevaluasi apakah solusinya lulus pengujian unit fungsional untuk masalah pemrograman.

3 tembakan

MBPP

Benchmark MBPP menguji kemampuan model bahasa untuk memecahkan masalah dasar pemrograman Python, yang berfokus pada konsep pemrograman dasar dan penggunaan library standar.

maj@1

GSM8K

Tolok ukur GSM8K menguji kemampuan model bahasa untuk menyelesaikan soal matematika di tingkat sekolah dasar yang sering kali memerlukan beberapa langkah penalaran.

4 tembakan

MATH

Tolok ukur MATH mengevaluasi kemampuan model bahasa untuk memecahkan soal cerita matematika yang kompleks, yang membutuhkan penalaran, pemecahan masalah multi-langkah, dan pemahaman konsep matematika.

AGIEval

Tolok ukur AGIEval menguji kecerdasan umum model bahasa dengan menggunakan pertanyaan yang berasal dari ujian dunia nyata yang dirancang untuk menilai kemampuan intelektual manusia (ujian masuk perguruan tinggi, ujian hukum, dll.).

BBH

Tolok ukur BBH (Big-Bench Hard) berfokus pada tugas-tugas yang dianggap di luar kemampuan model bahasa saat ini, yang menguji batasan mereka di berbagai bidang pemikiran dan pemahaman.

100%

75%

50%

25%

100%

75%

50%

25%

Gemma

7 m

64,3

Gemma

2 m

42,3

Mistral

7 m

62,5

LLAMA-2

13 m

54,8

LLAMA-2

7 m

45,3

Gemma

7 m

81,2

Gemma

2 m

71,4

Mistral

7 m

81,0

LLAMA-2

13 m

80,7

LLAMA-2

7 m

77,2

Gemma

7 m

81,2

Gemma

2 m

77,3

Mistral

7 m

82,2

LLAMA-2

13 m

80,5

LLAMA-2

7 m

78,8

Gemma

7 m

51,8

Gemma

2 m

49,7

Mistral

7 m

47,0*

LLAMA-2

13 m

50,3

LLAMA-2

7 m

48,3

Gemma

7 m

83,2

Gemma

2 m

69,42

Mistral

7 m

83,2*

LLAMA-2

13 m

81,7

LLAMA-2

7 m

77,4

Gemma

7 m

72,3

Gemma

2 m

65,4

Mistral

7 m

74,2

LLAMA-2

13 m

72,8

LLAMA-2

7 m

69,2

Gemma

7 m

71,3

Gemma

2 m

65,3

Mistral

7 m

66,3*

LLAMA-2

13 m

67,3

LLAMA-2

7 m

57,8

Gemma

7 m

52,8

Gemma

2 m

47,8

Mistral

7 m

52,2

LLAMA-2

13 m

57,0

LLAMA-2

7 m

58,6

Gemma

7 m

81,5

Gemma

2 m

73,2

Mistral

7 m

80,5

LLAMA-2

13 m

77,3

LLAMA-2

7 m

75,2

Gemma

7 m

53,2

Gemma

2 m

42,06

Mistral

7 m

54,9

LLAMA-2

13 m

49,4

LLAMA-2

7 m

45,9

Gemma

7 m

63,4

Gemma

2 m

53,2

Mistral

7 m

62,5

LLAMA-2

13 m

79,6

LLAMA-2

7 m

72,1

Gemma

7 m

32,3

Gemma

2 m

22,0

Mistral

7 m

26,2

LLAMA-2

13 m

18,3

LLAMA-2

7 m

12,8

Gemma

7 m

44,4

Gemma

2 m

29,2

Mistral

7 m

40,2*

LLAMA-2

13 m

30.6

LLAMA-2

7 m

20,8

Gemma

7 m

46,4

Gemma

2 m

17,7

Mistral

7 m

35,4*

LLAMA-2

13 m

28,7

LLAMA-2

7 m

14,6

Gemma

7 m

24,3

Gemma

2 m

11.8

Mistral

7 m

12,7

LLAMA-2

13 m

3.9

LLAMA-2

7 m

2.5

Gemma

7 m

41,7

Gemma

2 m

24,2

Mistral

7 m

41,2*

LLAMA-2

13 m

39,1

LLAMA-2

7 m

29,3

Gemma

7 m

55.1

Gemma

2 m

35,2

Mistral

7 m

56,1*

LLAMA-2

13 m

39,4

LLAMA-2

7 m

32,6

*Lihat laporan teknis untuk detail tentang performa dengan metodologi lainnya

Baca laporan teknis

Akses Gemma sekarang

Model Gemma tersedia di semua hub model favorit Anda.

Model Kaggle

Temukan model Gemma dalam banyak framework populer dan library contoh kode yang diuji komunitas dan terus berkembang.

Mulai

Vertex AI Model Garden

Sesuaikan model Gemma dengan data Anda sendiri, deploy ke aplikasi hanya dengan sekali klik, dan skalakan dengan ML Ops bawaan secara end-to-end.

Mulai

Model Wajah Memeluk

Akses, tingkatkan kualitas, dan deploy model Gemma dengan library Transformer Wajah Peluk, PEFT, dan Inferensi Pembuatan Teks.

Mulai

Pengembangan responsible AI

Tanggung Jawab berdasarkan Desain

dilatih sebelumnya dengan data yang diseleksi dengan cermat dan disesuaikan dengan keamanan terbaik, membantu memberdayakan pengembangan AI yang aman dan bertanggung jawab berdasarkan model Gemma.

Evaluasi yang Kuat dan Transparan

Evaluasi komprehensif dan pelaporan yang transparan mengungkap batasan model untuk menerapkan pendekatan yang bertanggung jawab bagi setiap kasus penggunaan.

Mendukung Pengembangan yang Bertanggung Jawab

Toolkit AI Generatif yang Responsible mendukung developer untuk merancang dan menerapkan praktik terbaik Responsible AI.

Pelajari Toolkit AI Generatif yang Bertanggung Jawab

Dioptimalkan untuk Google Cloud

Dengan model Gemma di Google Cloud, Anda dapat menyesuaikan model secara mendalam dengan kebutuhan spesifik Anda menggunakan alat Vertex AI yang terkelola sepenuhnya atau opsi GKE yang dikelola sendiri dan men-deploy-nya ke infrastruktur yang fleksibel dan hemat biaya dengan AI.

Pelajari lebih lanjut di blog Google Cloud

Mempercepat riset akademik dengan kredit Google Cloud

Tingkatkan riset Anda dengan model PaliGemma di Google Cloud. Gelombang baru model terbuka multimodal ini memperluas dukungan kami untuk penelitian mutakhir. Daftar sekarang untuk menerima kredit Google Cloud agar dapat melampaui batas penelitian Anda dan berkontribusi pada kemajuan komunitas ilmiah.

Peneliti yang terpilih akan menerima kredit Google Cloud untuk mempercepat upaya ilmiah mereka.

Daftar sekarang

Bergabunglah dengan komunitas

Terhubung, jelajahi, dan bagikan pengetahuan Anda dengan orang lain di komunitas model ML.

Model terbuka Gemma

Bertanggung jawab dari desain

Performa yang tidak tertandingi dalam ukuran

Framework fleksibel

Varian model Gemma

Gemma

CodeGemma

PaliGemma

RecurrentGemma

Panduan memulai untuk developer

Temukan panduan memulai di Kaggle

Latih dan deploy di Google Cloud

Coba adaptasi peringkat rendah dengan JAX via Keras 3

Panduan memulai cepat partner

Tolok ukur

Akses Gemma sekarang

Pengembangan responsible AI

Tanggung Jawab berdasarkan Desain

Evaluasi yang Kuat dan Transparan

Mendukung Pengembangan yang Bertanggung Jawab

Dioptimalkan untuk Google Cloud

Mempercepat riset akademik dengan kredit Google Cloud

Bergabunglah dengan komunitas

Kaggle

Discord

Blog