إرشادات حول تنسيق Gemma ونظامها

يتم تدريب نماذج Gemma المحسَّنة بالتعليمات (IT) باستخدام مُنسِق معيّن يُضيف تعليقات توضيحية على جميع أمثلة تحسين التعليمات باستخدام معلومات إضافية، سواء في وقت التدريب أو وقت الاستنتاج. يخدم التنسيق غرضَين:

  1. الإشارة إلى الأدوار في محادثة، مثل أدوار النظام أو المستخدم أو المساعد
  2. تحديد الأدوار في المحادثة، خاصةً في المحادثات التي تتضمّن عدة أدوار

في ما يلي تحديد الرموز المميّزة للتحكّم التي تستخدمها Gemma وحالات استخدامها. يُرجى العلم أنّ الرموز المميزة للتحكّم محجوزة في أداة تقسيم الكلمات الخاصة بنا.

  • الرمز المميّز للإشارة إلى دور المستخدم: user
  • الرمز المميّز للإشارة إلى منعطف في النموذج: model
  • الرمز المميّز للإشارة إلى بداية دور الحوار: <start_of_turn>
  • رمز مميز للإشارة إلى نهاية دور المتحدّث في الحوار: <end_of_turn>

في ما يلي مثال على حوار:

<start_of_turn>user
knock knock<end_of_turn>
<start_of_turn>model
who is there<end_of_turn>
<start_of_turn>user
Gemma<end_of_turn>
<start_of_turn>model
Gemma who?<end_of_turn>

الرمز المميّز "<end_of_turn>\n" هو فاصل المقاطع، وبادئة الطلب هي "<start_of_turn>model\n". وهذا يعني أنّه إذا أردت توجيه سؤال إلى النموذج مثل "ما هي قاعدة كرامر؟"، عليك بدلاً من ذلك إرسال بيانات إلى النموذج على النحو التالي:

"<start_of_turn>user
What is Cramer's Rule?<end_of_turn>
<start_of_turn>model"

يُرجى العِلم أنّه إذا أردت تحسين نماذج Gemma المدربة مسبقًا باستخدام بياناتك الخاصة، يمكنك استخدام أي مخطّط من هذا القبيل للرموز المميزة للتحكّم، ما دام متّسقًا بين حالات استخدام التدريب والاستنتاج.

تعليمات النظام

تم تصميم نماذج Gemma المخصّصة للتعليمات للعمل مع دورَين فقط: user وmodel. لذلك، لا يمكن استخدام دور system أو ميزة "تبديل النظام".

بدلاً من استخدام دور نظام منفصل، قدِّم تعليمات على مستوى النظام مباشرةً في طلب المستخدم الأولي. تتيح قدرات اتّباع تعليمات النماذج لجيما تفسير التعليمات بفعالية. على سبيل المثال:

<start_of_turn>user
Only reply like a pirate.

What is the answer to life the universe and everything?<end_of_turn>
<start_of_turn>model
Arrr, 'tis 42,<end_of_turn>