জেনারেটিভ মডেল সম্পর্কে

জেনারেটিভ কৃত্রিম বুদ্ধিমত্তা (AI) মডেল যেমন জেমিনি ফ্যামিলি অফ মডেলগুলি পাঠ্য, ছবি এবং অডিও সহ বিভিন্ন ধরণের ডেটা ইনপুট থেকে সামগ্রী তৈরি করতে সক্ষম। তাদের সবচেয়ে মৌলিক স্তরে, এই মডেলগুলি পরিশীলিত স্বয়ংসম্পূর্ণ অ্যাপ্লিকেশনগুলির মতো কাজ করে৷ প্রদত্ত ইনপুট পাঠ্য ("আপনি একটি ঘোড়াকে জলের দিকে নিয়ে যেতে পারেন,"), একটি জেনারেটিভ মডেল ভবিষ্যদ্বাণী করতে পারে যে আউটপুট পাঠ্য যা পরিসংখ্যানগতভাবে অনুসরণ করার সম্ভাবনা রয়েছে ("কিন্তু আপনি এটি পান করতে পারবেন না"), তাদের প্রশিক্ষণ থেকে শেখা নিদর্শনগুলির উপর ভিত্তি করে তথ্য আপনি বিভিন্ন অ্যাপ্লিকেশনের জন্য জেনারেটিভ মডেলের এই মৌলিক সম্পত্তি ব্যবহার করতে পারেন:

  • কবিতা, ছোট গল্প, রূপক এবং ব্লগ পোস্টের মতো সৃজনশীল লেখা তৈরি করুন
  • স্ট্রাকচার্ড ডেটাকে ফ্রিফর্ম টেক্সটে রূপান্তর করুন
  • ফ্রিফর্ম টেক্সট থেকে তথ্য বের করুন এবং সংক্ষিপ্ত করুন
  • কোড তৈরি করুন
  • ভাষার মধ্যে অনুবাদ করুন

এই বৈশিষ্ট্যগুলি তৈরি করতে জেনারেটিভ মডেলগুলি ব্যবহার করার জন্য কোনও মেশিন লার্নিং (এমএল) দক্ষতার প্রয়োজন হয় না। আপনাকে একটি বড় ডেটাসেট সংগ্রহ করতে বা একটি মডেল প্রশিক্ষণের প্রয়োজন নেই৷ আপনার প্রথম প্রোটোটাইপ শুরু করতে যা লাগে তা হল আপনি মডেলটিকে কয়েকটি বাক্যে কী করতে চান তা বর্ণনা করা।

জেনারেটিভ মডেল যা শুধুমাত্র টেক্সট ইনপুট এবং আউটপুট পরিচালনা করে তারা বড় ভাষা মডেল (LLM) নামেও পরিচিত। মডেলের জেমিনি পরিবার টেক্সট ডেটার চেয়ে বেশি প্রক্রিয়া করতে পারে, এবং যখন তারা একটি LLM-এর কার্য সম্পাদন করতে পারে, তারা আরও সঠিকভাবে জেনারেটিভ মডেল হিসাবে পরিচিত।

উদাহরণ অ্যাপ্লিকেশন

নিম্নলিখিত উদাহরণগুলি একটি জেনারেটিভ মডেল থেকে সাধারণ পাঠ্য ইনপুট এবং আউটপুট দেখায়।

একটি কবিতা তৈরি করুন

ব্যবহারকারীর ইনপুট: Write me a four-line poem about puppies and Android phones. Make sure it rhymes.

মডেল আউটপুট:

Puppies are cute,
Android phones are neat,
They both bring joy,
And make life complete.

একটি তালিকা তৈরি করুন

ব্যবহারকারীর ইনপুট: Generate a bulleted list of items I need to pack for a three-day camping trip.

মডেল আউটপুট:

*   Tent
*   Sleeping bag
*   Sleeping pad
*   Camp stove
*   Pots and pans
*   Utensils
*   Food
*   Water
*   First-aid kit
*   Sunscreen
*   Insect repellent
*   ...

আপনি শুধুমাত্র সঠিক ইনপুট টেক্সট তৈরি করে, যাকে প্রম্পটও বলা হয়, এর মতো সব ধরণের দরকারী আচরণ তৈরি করার জন্য জেনারেটিভ মডেল পেতে পারেন। আপনি যা চান তা করার জন্য জেনারেটিভ মডেলগুলি পেতে সঠিক শব্দগুলি বের করার শিল্প এবং বিজ্ঞানকে প্রম্পট ডিজাইন বলা হয় (এটিকে "প্রম্পট ইঞ্জিনিয়ারিং" বা সহজভাবে "প্রম্পটিং"ও বলা হয়)।

প্রম্পট ডিজাইন 101

পূর্ববর্তী বিভাগে প্রম্পটের কিছু উদাহরণ দেখানো হয়েছে যাতে একটি নির্দেশ রয়েছে, যেমন 'আমাকে একটি কবিতা লিখুন'। এই ধরনের নির্দেশনা নির্দিষ্ট ধরনের কাজের জন্য ভাল কাজ করতে পারে। যাইহোক, অন্যান্য অ্যাপ্লিকেশনের জন্য, অল্প-শট প্রম্পটিং নামে আরেকটি প্রম্পটিং কৌশল আরও ভাল কাজ করতে পারে। কিছু-শট প্রম্পট এই সত্যটির সুবিধা নেয় যে বড় ভাষার মডেলগুলি পাঠ্য ডেটাতে প্যাটার্নগুলি সনাক্ত করতে এবং প্রতিলিপি করার ক্ষেত্রে অবিশ্বাস্যভাবে ভাল। ধারণাটি হল জেনারেটিভ মডেলটিকে একটি পাঠ্য প্যাটার্ন পাঠানো যা এটি সম্পূর্ণ করতে শেখে। উদাহরণস্বরূপ, বলুন আপনি একটি অ্যাপ্লিকেশন তৈরি করতে চান যা একটি দেশের নাম ইনপুট হিসাবে নেয় এবং এর রাজধানী শহর আউটপুট করে। এটি করার জন্য এখানে একটি পাঠ্য প্রম্পট ডিজাইন করা হয়েছে:

Italy : Rome
France : Paris
Germany :

এই প্রম্পটে, আপনি একটি প্যাটার্ন স্থাপন করেন: [country] : [capital] । আপনি যদি এই প্রম্পটটি একটি বড় ভাষার মডেলে পাঠান, তাহলে এটি প্যাটার্নটিকে স্বয়ংসম্পূর্ণ করবে এবং এইরকম কিছু ফিরিয়ে দেবে:

     Berlin
Turkey : Ankara
Greece : Athens

এই মডেল প্রতিক্রিয়া একটু অদ্ভুত দেখতে হতে পারে. মডেলটি শুধুমাত্র জার্মানির রাজধানী (আপনার হাতে লেখা প্রম্পটে শেষ দেশ) নয়, অতিরিক্ত দেশ এবং মূলধন জোড়ার একটি সম্পূর্ণ তালিকাও ফিরিয়ে দিয়েছে। কারণ জেনারেটিভ মডেলটি "প্যাটার্নটি চালিয়ে যাচ্ছে।" আপনি যদি এমন একটি ফাংশন তৈরি করার চেষ্টা করছেন যা আপনাকে একটি ইনপুট দেশের রাজধানী বলে দেয় ("জার্মানি: বার্লিন"), আপনি সম্ভবত "বার্লিন" এর পরে মডেলটি তৈরি করা কোনও পাঠ্যের বিষয়ে সত্যিই চিন্তা করবেন না। প্রকৃতপক্ষে, অ্যাপ্লিকেশন ডিজাইনার হিসাবে, আপনি সম্ভবত সেই বহিরাগত উদাহরণগুলিকে ছাঁটাই করতে চান। আরো কি, আপনি সম্ভবত ইনপুট প্যারামিটারাইজ করতে চান, যাতে জার্মানি একটি নির্দিষ্ট স্ট্রিং নয় কিন্তু একটি পরিবর্তনশীল যা শেষ ব্যবহারকারী প্রদান করে:

Italy : Rome
France : Paris
<user input here> :

দেশের রাজধানী তৈরির জন্য আপনি মাত্র কয়েকটি-শট প্রম্পট লিখেছেন।

আপনি এই কয়েকটি-শট প্রম্পট টেমপ্লেট অনুসরণ করে প্রচুর সংখ্যক কাজ সম্পাদন করতে পারেন। এখানে একটি সামান্য ভিন্ন বিন্যাস সহ কয়েকটি শট প্রম্পট রয়েছে যা পাইথনকে জাভাস্ক্রিপ্টে রূপান্তর করে:

Convert Python to JavaScript.
Python: print("hello world")
JavaScript: console.log("hello world")
Python: for x in range(0, 100):
JavaScript: for(var i = 0; i < 100; i++) {
Python: ${USER INPUT HERE}
JavaScript:

অথবা, এই "বিপরীত অভিধান" প্রম্পট নিন। একটি সংজ্ঞা দেওয়া হলে, এটি সেই সংজ্ঞার সাথে মানানসই শব্দটি ফেরত দেয়:

Given a definition, return the word it defines.
Definition: When you're happy that other people are also sad.
Word: schadenfreude
Definition: existing purely in the mind, but not in physical reality
Word: abstract
Definition: ${USER INPUT HERE}
Word:

আপনি হয়তো লক্ষ্য করেছেন যে এই কয়েকটি-শট প্রম্পটগুলির সঠিক প্যাটার্ন সামান্য পরিবর্তিত হয়। উদাহরণ ধারণ করা ছাড়াও, আপনার প্রম্পটগুলিতে নির্দেশাবলী প্রদান করা আপনার নিজস্ব প্রম্পট লেখার সময় বিবেচনা করার জন্য একটি অতিরিক্ত কৌশল, কারণ এটি মডেলের সাথে আপনার অভিপ্রায়ের সাথে যোগাযোগ করতে সহায়তা করে।

প্রম্পটিং বনাম ঐতিহ্যগত সফ্টওয়্যার উন্নয়ন

প্রথাগত সফ্টওয়্যারগুলির বিপরীতে যা একটি সাবধানে লিখিত বৈশিষ্ট্যের জন্য ডিজাইন করা হয়েছে, জেনারেটিভ মডেলগুলির আচরণ এমনকি মডেল প্রশিক্ষকদের কাছেও অনেকাংশে অস্বচ্ছ। ফলস্বরূপ, আপনি প্রায়শই আগাম ভবিষ্যদ্বাণী করতে পারেন না যে কোন ধরনের প্রম্পট কাঠামো একটি নির্দিষ্ট মডেলের জন্য সবচেয়ে ভাল কাজ করবে। আরও কী, একটি জেনারেটিভ মডেলের আচরণ তার প্রশিক্ষণের ডেটা দ্বারা বৃহৎ অংশে নির্ধারিত হয়, এবং যেহেতু মডেলগুলি ক্রমাগত নতুন ডেটাসেটে টিউন করা হয়, কখনও কখনও মডেলটি যথেষ্ট পরিবর্তিত হয় যে এটি অসাবধানতাবশত পরিবর্তন করে কোন প্রম্পট কাঠামোগুলি সবচেয়ে ভাল কাজ করে। এটা আপনার জন্য কি মানে? এক্সপেরিমেন্ট ! বিভিন্ন প্রম্পট বিন্যাস চেষ্টা করুন.

মডেল পরামিতি

আপনি মডেলে পাঠানো প্রতিটি প্রম্পটে প্যারামিটার মান অন্তর্ভুক্ত করে যা নিয়ন্ত্রণ করে কিভাবে মডেলটি একটি প্রতিক্রিয়া তৈরি করে। মডেল বিভিন্ন পরামিতি মান জন্য বিভিন্ন ফলাফল তৈরি করতে পারে. সবচেয়ে সাধারণ মডেল পরামিতি হল:

  1. সর্বাধিক আউটপুট টোকেন: প্রতিক্রিয়াতে তৈরি করা যেতে পারে এমন সর্বাধিক সংখ্যক টোকেন নির্দিষ্ট করে। একটি টোকেন প্রায় চারটি অক্ষরের। 100 টোকেন প্রায় 60-80 শব্দের সাথে মিলে যায়।

  2. তাপমাত্রা: তাপমাত্রা টোকেন নির্বাচনের এলোমেলোতার মাত্রা নিয়ন্ত্রণ করে। রেসপন্স জেনারেশনের সময় নমুনা নেওয়ার জন্য তাপমাত্রা ব্যবহার করা হয়, যেটা ঘটে যখন topP এবং topK প্রয়োগ করা হয়। নিম্ন তাপমাত্রা প্রম্পটগুলির জন্য ভাল যেগুলির জন্য আরও নির্ধারক বা কম উন্মুক্ত প্রতিক্রিয়া প্রয়োজন, যখন উচ্চ তাপমাত্রা আরও বৈচিত্র্যময় বা সৃজনশীল ফলাফলের দিকে নিয়ে যেতে পারে। 0 এর তাপমাত্রা নির্ধারক, যার অর্থ সর্বোচ্চ সম্ভাব্য প্রতিক্রিয়া সর্বদা নির্বাচিত হয়।

  3. topK : topK প্যারামিটার পরিবর্তন করে কিভাবে মডেল আউটপুটের জন্য টোকেন নির্বাচন করে। 1-এর একটি topK মানে নির্বাচিত টোকেনটি মডেলের শব্দভান্ডারের সমস্ত টোকেনের মধ্যে সবচেয়ে সম্ভাব্য (যাকে লোভনীয় ডিকোডিংও বলা হয়), যখন 3-এর topK মানে হল তাপমাত্রা ব্যবহার করে 3টি সম্ভাব্য টোকেনের মধ্যে থেকে পরবর্তী টোকেনটি নির্বাচন করা হয়েছে৷ প্রতিটি টোকেন নির্বাচনের ধাপের জন্য, সর্বোচ্চ সম্ভাবনা সহ topK টোকেন নমুনা করা হয়। টোকেনগুলি তারপর তাপমাত্রার নমুনা ব্যবহার করে নির্বাচিত চূড়ান্ত টোকেন সহ topP এর উপর ভিত্তি করে আরও ফিল্টার করা হয়।

  4. topP : topP প্যারামিটার পরিবর্তন করে কিভাবে মডেলটি আউটপুটের জন্য টোকেন নির্বাচন করে। টোকেনগুলি সর্বাধিক থেকে সর্বনিম্ন সম্ভাব্য পর্যন্ত নির্বাচন করা হয় যতক্ষণ না তাদের সম্ভাব্যতার যোগফল topP মানের সমান হয়। উদাহরণস্বরূপ, যদি A, B, এবং C টোকেনগুলির 0.3, 0.2, এবং 0.1 এর সম্ভাবনা থাকে এবং topP মান 0.5 হয়, তাহলে মডেলটি তাপমাত্রা ব্যবহার করে পরবর্তী টোকেন হিসাবে A বা B নির্বাচন করবে এবং একটি হিসাবে C বাদ দেবে প্রার্থী ডিফল্ট topP মান হল 0.95।

  5. stop_sequences : মডেলকে কন্টেন্ট তৈরি করা বন্ধ করতে বলার জন্য একটি স্টপ সিকোয়েন্স সেট করুন। একটি স্টপ সিকোয়েন্স অক্ষরের যেকোনো ক্রম হতে পারে। উত্পন্ন সামগ্রীতে প্রদর্শিত হতে পারে এমন অক্ষরগুলির ক্রম ব্যবহার করা এড়াতে চেষ্টা করুন৷

প্রম্পট প্রকার

তাদের মধ্যে থাকা প্রাসঙ্গিক তথ্যের স্তরের উপর নির্ভর করে, প্রম্পটগুলিকে বিস্তৃতভাবে তিন প্রকারে শ্রেণীবদ্ধ করা হয়।

জিরো-শট প্রম্পট

এই প্রম্পটে মডেলের প্রতিলিপি করার উদাহরণ নেই। জিরো-শট প্রম্পটগুলি মূলত কোনও অতিরিক্ত উদাহরণ বা তথ্য ছাড়াই প্রম্পটটি সম্পূর্ণ করার মডেলের ক্ষমতা দেখায়। এর মানে হল মডেলটিকে তার প্রাক-বিদ্যমান জ্ঞানের উপর নির্ভর করতে হবে একটি যুক্তিযুক্ত উত্তর তৈরি করতে।

কিছু সাধারণভাবে ব্যবহৃত জিরো-শট প্রম্পট প্যাটার্ন হল:

  • নির্দেশ-বিষয়বস্তু
<Overall instruction>
<Content to operate on>

যেমন,

Summarize the following into two sentences at the third-grade level:

Hummingbirds are the smallest birds in the world, and they are also one of the
most fascinating. They are found in North and South America, and they are known
for their long, thin beaks and their ability to fly at high speeds.

Hummingbirds are made up of three main parts: the head, the body, and the tail.
The head is small and round, and it contains the eyes, the beak, and the brain.
The body is long and slender, and it contains the wings, the legs, and the
heart. The tail is long and forked, and it helps the hummingbird to balance
while it is flying.

Hummingbirds are also known for their coloration. They come in a variety of
colors, including green, blue, red, and purple. Some hummingbirds are even able
to change their color!

Hummingbirds are very active creatures. They spend most of their time flying,
and they are also very good at hovering. Hummingbirds need to eat a lot of food
in order to maintain their energy, and they often visit flowers to drink nectar.

Hummingbirds are amazing creatures. They are small, but they are also very
powerful. They are beautiful, and they are very important to the ecosystem.
  • নির্দেশ-বস্তু-নির্দেশ
<Overall instruction or context setting>
<Content to operate on>
<Final instruction>

যেমন,

Here is some text I'd like you to summarize:

Hummingbirds are the smallest birds in the world, and they are also one of the
most fascinating. They are found in North and South America, and they are known
for their long, thin beaks and their ability to fly at high speeds. Hummingbirds
are made up of three main parts: the head, the body, and the tail. The head is
small and round, and it contains the eyes, the beak, and the brain. The body is
long and slender, and it contains the wings, the legs, and the heart. The tail
is long and forked, and it helps the hummingbird to balance while it is flying.
Hummingbirds are also known for their coloration. They come in a variety of
colors, including green, blue, red, and purple. Some hummingbirds are even able
to change their color! Hummingbirds are very active creatures. They spend most
of their time flying, and they are also very good at hovering. Hummingbirds need
to eat a lot of food in order to maintain their energy, and they often visit
flowers to drink nectar. Hummingbirds are amazing creatures. They are small, but
they are also very powerful. They are beautiful, and they are very important to
the ecosystem.

Summarize it in two sentences at the third-grade reading level.
  • ধারাবাহিকতা। কখনও কখনও, আপনি কোনও নির্দেশ ছাড়াই মডেলটি চালিয়ে যেতে পারেন৷ উদাহরণস্বরূপ, এখানে একটি শূন্য-শট প্রম্পট রয়েছে যেখানে মডেলটি প্রদত্ত ইনপুটটি চালিয়ে যাওয়ার উদ্দেশ্যে করা হয়েছে:
Once upon a time, there was a little sparrow building a nest in a farmer's
barn. This sparrow

সৃজনশীল পাঠ্য বিন্যাস তৈরি করতে জিরো-শট প্রম্পট ব্যবহার করুন, যেমন কবিতা, কোড, স্ক্রিপ্ট, মিউজিক্যাল টুকরা, ইমেল বা অক্ষর।

এক শট প্রম্পট

এই প্রম্পটগুলি মডেলটিকে প্রতিলিপি এবং প্যাটার্নটি চালিয়ে যাওয়ার জন্য একটি একক উদাহরণ প্রদান করে। এটি মডেল থেকে অনুমানযোগ্য প্রতিক্রিয়া তৈরি করার অনুমতি দেয়।

উদাহরণস্বরূপ, আপনি খাদ্য জুড়ি তৈরি করতে পারেন যেমন:

Food: Apple
Pairs with: Cheese
Food: Pear
Pairs with:

কয়েক শট প্রম্পট

এই প্রম্পটগুলি প্রতিলিপি করার জন্য একাধিক উদাহরণ সহ মডেল প্রদান করে। একটি প্যাটার্নের উপর ভিত্তি করে ডেটা সংশ্লেষণের মতো জটিল কাজগুলি সম্পূর্ণ করতে কয়েকটি শট প্রম্পট ব্যবহার করুন।

একটি উদাহরণ প্রম্পট হতে পারে:

Generate a grocery shopping list for a week for one person. Use the JSON format
given below.
{"item": "eggs", "quantity": "6"}
{"item": "bread", "quantity": "one loaf"}

হুড অধীনে জেনারেটিভ মডেল

এই বিভাগের উদ্দেশ্য প্রশ্নের উত্তর দেওয়া - জেনারেটিভ মডেলের প্রতিক্রিয়াগুলিতে কি এলোমেলোতা আছে, নাকি তারা নির্ধারক?

সংক্ষিপ্ত উত্তর - হ্যাঁ উভয়. আপনি যখন একটি জেনারেটিভ মডেলকে অনুরোধ করেন, তখন দুটি পর্যায়ে একটি পাঠ্য প্রতিক্রিয়া তৈরি হয়। প্রথম পর্যায়ে, জেনারেটিভ মডেল ইনপুট প্রম্পট প্রক্রিয়া করে এবং সম্ভাব্য টোকেনগুলির (শব্দ) উপর একটি সম্ভাব্যতা বন্টন তৈরি করে যা পরবর্তীতে আসতে পারে। উদাহরণ স্বরূপ, আপনি যদি ইনপুট টেক্সট দিয়ে প্রম্পট করেন "The dog jumped over the...", জেনারেটিভ মডেলটি সম্ভাব্য পরবর্তী শব্দগুলির একটি অ্যারে তৈরি করবে:

[("fence", 0.77), ("ledge", 0.12), ("blanket", 0.03), ...]

এই প্রক্রিয়াটি নির্ধারক; একটি জেনারেটিভ মডেল প্রতিবার একই প্রম্পট টেক্সট ইনপুট করার সময় একই বন্টন তৈরি করবে।

দ্বিতীয় পর্যায়ে, জেনারেটিভ মডেল বিভিন্ন ডিকোডিং কৌশলগুলির মধ্যে একটির মাধ্যমে এই বিতরণগুলিকে প্রকৃত পাঠ্য প্রতিক্রিয়াগুলিতে রূপান্তরিত করে। একটি সাধারণ ডিকোডিং কৌশল প্রতিটি টাইমস্টেপে সর্বাধিক সম্ভাব্য টোকেন নির্বাচন করতে পারে। এই প্রক্রিয়া সবসময় নির্ধারক হবে. যাইহোক, আপনি পরিবর্তে মডেল দ্বারা ফেরত বিতরণের উপর এলোমেলোভাবে নমুনা তৈরি করে একটি প্রতিক্রিয়া তৈরি করতে বেছে নিতে পারেন। এই প্রক্রিয়াটি স্টোকাস্টিক (এলোমেলো) হবে। তাপমাত্রা সেট করে এই ডিকোডিং প্রক্রিয়ায় অনুমোদিত এলোমেলোতার ডিগ্রি নিয়ন্ত্রণ করুন। 0 এর তাপমাত্রা মানে শুধুমাত্র সবচেয়ে সম্ভাব্য টোকেন নির্বাচন করা হয়েছে, এবং কোন এলোমেলোতা নেই। বিপরীতভাবে, একটি উচ্চ তাপমাত্রা মডেল দ্বারা নির্বাচিত টোকেনগুলিতে উচ্চ মাত্রার এলোমেলোতা ইনজেক্ট করে, যা আরও অপ্রত্যাশিত, আশ্চর্যজনক মডেল প্রতিক্রিয়ার দিকে পরিচালিত করে।

আরও পড়া

  • এখন যেহেতু আপনি প্রম্পট এবং জেনারেটিভ মডেল সম্পর্কে গভীরভাবে বুঝতে পেরেছেন, Google AI স্টুডিও ব্যবহার করে আপনার নিজস্ব প্রম্পট লেখার চেষ্টা করুন।
  • প্রম্পট তৈরির জন্য সর্বোত্তম অনুশীলন সম্পর্কে আরও জানতে প্রম্পট নির্দেশিকা পড়ুন।