Gemma 4 dirilis dengan input teks, audio, dan gambar serta jendela konteks panjang hingga 256K token. Pelajari lebih lanjut

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Petunjuk format dan sistem Gemma

Model Gemma yang disesuaikan dengan petunjuk (IT) dilatih dengan formator tertentu yang menambahkan anotasi pada semua contoh penyesuaian petunjuk dengan informasi tambahan, baik pada waktu pelatihan maupun inferensi. Formatter memiliki dua tujuan:

Menunjukkan peran dalam percakapan, seperti peran sistem, pengguna, atau asisten.
Menjelaskan giliran dalam percakapan, terutama dalam percakapan multi-giliran.

Di bawah ini, kami menentukan token kontrol yang digunakan oleh Gemma dan kasus penggunaannya. Perhatikan bahwa token kontrol dicadangkan dalam dan khusus untuk tokenizer kami.

Token untuk menunjukkan giliran pengguna: user
Token untuk menunjukkan giliran model: model
Token untuk menunjukkan awal giliran dialog: <start_of_turn>
Token untuk menunjukkan akhir giliran dialog: <end_of_turn>

Berikut adalah contoh dialog:

<start_of_turn>user
knock knock<end_of_turn>
<start_of_turn>model
who is there<end_of_turn>
<start_of_turn>user
Gemma<end_of_turn>
<start_of_turn>model
Gemma who?<end_of_turn>

Token "<end_of_turn>\n" adalah pemisah belokan, dan awalan perintah adalah "<start_of_turn>model\n". Artinya, jika ingin meminta model dengan pertanyaan seperti, "Apa itu Aturan Cramer?", Anda harus memberi makan model sebagai berikut:

"<start_of_turn>user
What is Cramer's Rule?<end_of_turn>
<start_of_turn>model"

Perhatikan bahwa jika ingin menyesuaikan model Gemma terlatih dengan data Anda sendiri, Anda dapat menggunakan skema tersebut untuk token kontrol, asalkan konsisten antara kasus penggunaan pelatihan dan inferensi.

Petunjuk sistem

Model yang disesuaikan dengan petunjuk Gemma dirancang agar hanya berfungsi dengan dua peran: user dan model. Oleh karena itu, peran system atau giliran sistem tidak didukung.

Daripada menggunakan peran sistem terpisah, berikan petunjuk tingkat sistem langsung dalam perintah pengguna awal. Kemampuan petunjuk model yang diikuti memungkinkan Gemma menafsirkan petunjuk secara efektif. Contoh:

<start_of_turn>user
Only reply like a pirate.

What is the answer to life the universe and everything?<end_of_turn>
<start_of_turn>model
Arrr, 'tis 42,<end_of_turn>