Gemma biçimlendirme ve sistem talimatları

Gemma talimat ayarlı (IT) modelleri, hem eğitim hem de çıkarım sırasında tüm talimat ayarı örneklerini ek bilgilerle açıklayan belirli bir düzenleyici ile eğitilir. Düzenleyicinin iki amacı vardır:

  1. Bir sohbette sistem, kullanıcı veya asistan rolleri gibi rolleri belirtme.
  2. Özellikle çok katılımlı sohbetlerde konuşma sırasını belirtme

Aşağıda, Gemma tarafından kullanılan kontrol jetonlarını ve kullanım alanlarını belirtiyoruz. Kontrol jetonlarının, dize ayırıcımızda ayrılmış ve dize ayırıcımıza özgü olduğunu unutmayın.

  • Kullanıcı sırasını belirten jeton: user
  • Model dönüşümünü belirten jeton: model
  • Diyalog sırasının başlangıcını belirten jeton: <start_of_turn>
  • Diyalog sırasının sonunu belirten jeton: <end_of_turn>

Aşağıda örnek bir diyalog verilmiştir:

<start_of_turn>user
knock knock<end_of_turn>
<start_of_turn>model
who is there<end_of_turn>
<start_of_turn>user
Gemma<end_of_turn>
<start_of_turn>model
Gemma who?<end_of_turn>

"<end_of_turn>\n" jetonu, sıra ayırıcıdır ve istem ön eki "<start_of_turn>model\n"'dur. Yani modele "Cramer Kuralı nedir?" gibi bir soru sormak istiyorsanız modele şu şekilde bilgi vermeniz gerekir:

"<start_of_turn>user
What is Cramer's Rule?<end_of_turn>
<start_of_turn>model"

Önceden eğitilmiş Gemma modellerinde kendi verilerinizle hassas ayar yapmak istiyorsanız eğitim ve çıkarım kullanım alanlarınız arasında tutarlı olduğu sürece kontrol jetonları için bu tür bir şemayı kullanabileceğinizi unutmayın.

Sistem talimatları

Gemma'nın talimat ayarlı modelleri yalnızca iki rolle çalışacak şekilde tasarlanmıştır: user ve model. Bu nedenle, system rolü veya sistem dönüşü desteklenmez.

Ayrı bir sistem rolü kullanmak yerine, sistem düzeyindeki talimatları doğrudan ilk kullanıcı isteminde sağlayın. Model talimatlarını takip etme özellikleri, Gemma'nın talimatları etkili bir şekilde yorumlamasına olanak tanır. Örneğin:

<start_of_turn>user
Only reply like a pirate.

What is the answer to life the universe and everything?<end_of_turn>
<start_of_turn>model
Arrr, 'tis 42,<end_of_turn>