মডেল প্রান্তিককরণ

একটি কৃত্রিম বুদ্ধিমত্তা (AI) মডেলের জন্য একটি প্রম্পট তৈরি করা, যেমন Gemini বা Gemma, যা আপনার উদ্দেশ্যকে পুরোপুরি ক্যাপচার করে একটি অ-তুচ্ছ কাজ হতে পারে। প্রায়শই, আপনাকে অবশ্যই হাতে একটি প্রম্পট লিখতে হবে এবং তারপরে এটি আপনার প্রয়োজনের সাথে মানানসই তা নিশ্চিত করার জন্য বিভিন্ন ব্যবহারের ক্ষেত্রে এটি পরীক্ষা করতে হবে। ফলাফলের উপর ভিত্তি করে, আপনি প্রম্পটে লক্ষ্যযুক্ত আপডেট করতে পারেন: এক জায়গায় কিছু শব্দ পরিবর্তন করা, অন্য জায়গায় একটি নতুন বাক্য যোগ করা। এই প্রক্রিয়াটি খুব নীতিগত নয় এবং সেরা ফলাফলের দিকে পরিচালিত করতে পারে না।

Google এমন একটি পদ্ধতি তৈরি করেছে যা LLM ব্যবহার করে স্বয়ংক্রিয়ভাবে একটি প্রম্পট টেমপ্লেট আপডেট করার জন্য মডেলের আউটপুট সম্পর্কে সরল ভাষায় আপনার দেওয়া প্রতিক্রিয়ার ভিত্তিতে। আপনার প্রতিক্রিয়া, প্রম্পট এবং মডেলের আউটপুট সহ, একটি LLM-এ পাঠানো হয় যা আপনার অভিপ্রেত আচরণের সাথে আরও ভালভাবে সারিবদ্ধ করার জন্য প্রম্পট আপডেট করে।

এই পদ্ধতি দুটি উপায়ে উপলব্ধ:

  • ওপেন সোর্স model-alignment পাইথন লাইব্রেরি আপনাকে নমনীয়ভাবে আপনার সফ্টওয়্যার এবং ওয়ার্কফ্লোতে এই পদ্ধতির অন্তর্ভুক্ত করতে দেয়।
  • এই পদ্ধতির একটি সংস্করণ Vertex AI স্টুডিওতে একত্রিত করা হয়েছে, যা আপনাকে মাত্র কয়েকটি ক্লিকের মাধ্যমে এই কর্মপ্রবাহটি ব্যবহার করতে দেয়।

ওপেন সোর্স লাইব্রেরি

মডেল অ্যালাইনমেন্ট হল একটি ওপেন-সোর্স পাইথন লাইব্রেরি , যা PyPI-তে একটি প্যাকেজ হিসাবে প্রকাশিত হয়েছে যা একটি API-এর মাধ্যমে মানুষের প্রতিক্রিয়া থেকে প্রম্পটগুলির সারিবদ্ধকরণ সক্ষম করে। লাইব্রেরিটি মানুষের প্রতিক্রিয়া এবং লেবেল-ডেটা থেকে স্বয়ংক্রিয় শ্রেণীবদ্ধকরণের মাধ্যমে দ্রুত আপডেট করার বিষয়ে আমাদের গবেষণার উপর ভিত্তি করে।

মডেল অ্যালাইনমেন্ট লাইব্রেরি ব্যবহার করে Gemma-এর জন্য প্রম্পট টেমপ্লেট কিউরেট করুন

Google Colab চালু করুন

এই লাইব্রেরি স্বয়ংক্রিয়ভাবে প্রম্পট টেমপ্লেট আপডেট করার জন্য দুটি ওয়ার্কফ্লো সমর্থন করে:

  1. নীতি থেকে পুনরাবৃত্তিমূলক আপডেট . এই ওয়ার্কফ্লো মডেলের আউটপুটের পরোক্ষ সমালোচনা থেকে বা মডেল আউটপুটের সরাসরি সম্পাদনা থেকে নির্দেশিকা পাতন করতে একটি LLM ব্যবহার করে। LLM-এ পাঠানোর আগে আপনি পুনরাবৃত্তিমূলকভাবে এক বা একাধিক নির্দেশিকা তৈরি করতে পারেন, যা সেই নির্দেশিকাগুলি মেনে চলার জন্য প্রম্পট টেমপ্লেট আপডেট করে। এছাড়াও আপনি নির্দেশিকাগুলিকে হাতে-কিরেট করতে পারেন এবং সেগুলিকে এলএলএম-পাসিতগুলির পাশাপাশি অন্তর্ভুক্ত করতে পারেন৷
  2. মডেল আউটপুট সরাসরি সমালোচনা . এই ওয়ার্কফ্লো সম্পূর্ণ মডেল আউটপুট সম্পর্কে আপনার প্রতিক্রিয়া নেয় এবং একটি আপডেট প্রম্পট টেমপ্লেট তৈরি করতে সরাসরি LLM-এ প্রম্পট এবং মডেল আউটপুট সহ এটিকে ফিড করে।

এই দুটি কর্মপ্রবাহ উভয়ই আপনার আবেদনের জন্য উপযোগী হতে পারে। উল্লেখযোগ্য ট্রেড-অফ হল নির্দেশিকাগুলির উপস্থিতি, যা একটি কার্যকর, কংক্রিট প্রসেস আর্টিফ্যাক্ট হতে পারে যা জানাতে সাহায্য করতে পারে, উদাহরণস্বরূপ, স্বচ্ছতার প্রতি আপনার দৃষ্টিভঙ্গি।

মডেল প্রান্তিককরণ ফ্লো চার্ট

চিত্র 1. এই ফ্লোচার্টটি ব্যাখ্যা করে যে কোথায় এবং কীভাবে দুটি মডেল অ্যালাইনমেন্ট লাইব্রেরি ওয়ার্কফ্লোগুলি আপনার প্রম্পট টেমপ্লেটগুলিতে নির্দেশিকা-চালিত বা সরাসরি আপডেটগুলি সক্ষম করতে বিচ্ছিন্ন হয়৷ নোট করুন যে প্রক্রিয়াটি পুনরাবৃত্তিমূলক, এবং এই কর্মপ্রবাহগুলি পারস্পরিকভাবে একচেটিয়া নয়, আপনি যে কোনও সময় তাদের মধ্যে স্যুইচ করতে পারেন।

Colab নোটবুকটি দেখুন যেটি উভয় ওয়ার্কফ্লো ব্যবহার করে Gemma 2-এর জন্য প্রম্পট সারিবদ্ধ করতে Gemini ব্যবহার করে।

ভার্টেক্স এআই স্টুডিওতে সারিবদ্ধকরণ

গুগলের ভার্টেক্স এআই স্টুডিও মডেল অ্যালাইনমেন্ট ওপেন সোর্স লাইব্রেরি থেকে প্রত্যক্ষ কর্মপ্রবাহের উপর ভিত্তি করে একটি "পরিমার্জন প্রম্পট" বৈশিষ্ট্য যুক্ত করেছে যা এর রচনা, চলমান, মূল্যায়ন এবং তুলনামূলক সরঞ্জামগুলির প্রশংসা করতে।

একটি প্রম্পট চালানোর পরে, আপনি মডেলটিকে ভিন্নভাবে আচরণ করার উপায়গুলির বিষয়ে প্রতিক্রিয়া প্রদান করতে পারেন এবং Vertex AI স্টুডিও একটি পুনর্লিখনের খসড়া তৈরি করতে Gemini ব্যবহার করে৷ আপনি প্রস্তাবিত পরিবর্তনগুলি গ্রহণ করতে পারেন এবং একটি বোতামে ক্লিক করে আপডেট করা প্রম্পটটি পুনরায় চালাতে পারেন, অথবা আপনার প্রতিক্রিয়া আপডেট করতে পারেন এবং মিথুনের খসড়া অন্য প্রার্থীকে নিতে পারেন৷

ভার্টেক্স এআই স্টুডিওতে মডেল সারিবদ্ধকরণ

চিত্র 2. ভার্টেক্স এআই স্টুডিওর "রিফাইন প্রম্পট" বৈশিষ্ট্যটি ব্যবহারকারীর প্রতিক্রিয়ার উপর ভিত্তি করে একটি প্রম্পট আপডেট করতে ব্যবহৃত হচ্ছে।

নিজের জন্য মডেল সারিবদ্ধতা অন্বেষণ করুন:

  • এই Colab নোটবুকটি চালান যা জেমিনি ব্যবহার করে আমাদের ওপেন-ওয়েট জেমা 2 মডেলের জন্য বিভিন্ন প্রম্পট সারিবদ্ধ করতে উভয় সারিবদ্ধ পদ্ধতি ব্যবহার করে।
  • Vertex AI স্টুডিওতে "রিফাইন প্রম্পট" মডেল অ্যালাইনমেন্ট বৈশিষ্ট্যটি ব্যবহার করে দেখুন।