Gemma instruction-tuned (IT) মডেলগুলিকে একটি নির্দিষ্ট ফরম্যাটার দিয়ে প্রশিক্ষিত করা হয় যা প্রশিক্ষণ এবং অনুমান উভয় সময়ে অতিরিক্ত তথ্য সহ সমস্ত নির্দেশ টিউনিং উদাহরণ টীকা করে। ফরম্যাটারটির দুটি উদ্দেশ্য রয়েছে:
- একটি কথোপকথনে ভূমিকা নির্দেশ করে, যেমন সিস্টেম , ব্যবহারকারী বা সহকারী ভূমিকা।
- কথোপকথনে মোড় বর্ণনা করা, বিশেষ করে বহু-পালা কথোপকথনে।
নীচে, আমরা জেমা দ্বারা ব্যবহৃত নিয়ন্ত্রণ টোকেন এবং তাদের ব্যবহারের ক্ষেত্রে উল্লেখ করি। নোট করুন যে কন্ট্রোল টোকেনগুলি আমাদের টোকেনাইজারের মধ্যে সংরক্ষিত এবং নির্দিষ্ট।
- ব্যবহারকারীর পালা নির্দেশ করতে টোকেন:
user
- একটি মডেল টার্ন নির্দেশ করতে টোকেন:
model
- সংলাপের মোড়ের শুরু নির্দেশ করার জন্য টোকেন:
<start_of_turn>
- সংলাপের মোড়ের শেষ নির্দেশ করার জন্য টোকেন:
<end_of_turn>
এখানে একটি উদাহরণ সংলাপ:
<start_of_turn>user
knock knock<end_of_turn>
<start_of_turn>model
who is there<end_of_turn>
<start_of_turn>user
Gemma<end_of_turn>
<start_of_turn>model
Gemma who?<end_of_turn>
টোকেন "<end_of_turn>\n"
হল টার্ন বিভাজক, এবং প্রম্পট উপসর্গ হল "<start_of_turn>model\n"
। এর মানে হল যে আপনি যদি মডেলটিকে একটি প্রশ্ন সহ প্রম্পট করতে চান, "ক্র্যামারের নিয়ম কী?", তাহলে আপনাকে পরিবর্তে মডেলটিকে নিম্নরূপ খাওয়াতে হবে:
"<start_of_turn>user
What is Cramer's Rule?<end_of_turn>
<start_of_turn>model"
মনে রাখবেন যে আপনি যদি আপনার নিজের ডেটার সাথে পূর্বপ্রশিক্ষিত জেমা মডেলগুলিকে সূক্ষ্মভাবে তৈরি করতে চান তবে আপনি নিয়ন্ত্রণ টোকেনের জন্য এই জাতীয় যে কোনও স্কিমা ব্যবহার করতে পারেন, যতক্ষণ না এটি আপনার প্রশিক্ষণ এবং অনুমান ব্যবহারের ক্ষেত্রে সামঞ্জস্যপূর্ণ।
সিস্টেম নির্দেশাবলী
জেমার নির্দেশ-সুরিত মডেলগুলি শুধুমাত্র দুটি ভূমিকার সাথে কাজ করার জন্য ডিজাইন করা হয়েছে: user
এবং model
। অতএব, system
ভূমিকা বা একটি সিস্টেম টার্ন সমর্থিত নয়।
একটি পৃথক সিস্টেম ভূমিকা ব্যবহার করার পরিবর্তে, প্রাথমিক ব্যবহারকারী প্রম্পটের মধ্যে সরাসরি সিস্টেম-স্তরের নির্দেশাবলী প্রদান করুন। মডেল নির্দেশাবলীর নিম্নলিখিত ক্ষমতাগুলি জেমাকে নির্দেশাবলী কার্যকরভাবে ব্যাখ্যা করতে দেয়। যেমন:
<start_of_turn>user
Only reply like a pirate.
What is the answer to life the universe and everything?<end_of_turn>
<start_of_turn>model
Arrr, 'tis 42,<end_of_turn>