ব্যাখ্যাযোগ্যতা সরঞ্জামগুলির সাথে মডেল আচরণ বিশ্লেষণ করুন

যদিও এআই-এর জন্য একটি দায়িত্বশীল পদ্ধতির মধ্যে নিরাপত্তা নীতি, মডেলের নিরাপত্তা উন্নত করার কৌশল, কীভাবে স্বচ্ছতা শিল্পকর্ম তৈরি করা যায়, জেনারেটিভ এআই-এর সাথে দায়িত্বশীল হওয়ার জন্য আপনার দৃষ্টিভঙ্গি কেবল একটি চেকলিস্ট অনুসরণ করা উচিত নয়। জেনারেটিভ এআই পণ্যগুলি তুলনামূলকভাবে নতুন এবং একটি অ্যাপ্লিকেশনের আচরণগুলি সফ্টওয়্যারের আগের ফর্মগুলির চেয়ে বেশি পরিবর্তিত হতে পারে। এই কারণে, আপনার ব্যবহৃত মেশিন লার্নিং মডেলগুলি পরীক্ষা করা উচিত, মডেলের আচরণের উদাহরণগুলি পরীক্ষা করা এবং বিস্ময়ের তদন্ত করা উচিত।

আজ, প্রম্পট করা বিজ্ঞানের মতোই শিল্প, কিন্তু এমন সরঞ্জাম রয়েছে যা আপনাকে বৃহৎ ভাষার মডেলগুলির জন্য প্রম্পটগুলিকে অভিজ্ঞতাগতভাবে উন্নত করতে সাহায্য করতে পারে, যেমন লার্নিং ইন্টারপ্রেটেবিলিটি টুল (LIT) ৷ LIT হল একটি ওপেন সোর্স প্ল্যাটফর্ম যা AI/ML মডেলগুলিকে ভিজ্যুয়ালাইজ, বোঝা এবং ডিবাগ করার জন্য তৈরি করা হয়েছে। নিচে একটি উদাহরণ দেওয়া হল কিভাবে LIT-কে Gemma-এর আচরণ অন্বেষণ করতে, সম্ভাব্য সমস্যাগুলি অনুমান করতে এবং এর নিরাপত্তার উন্নতি করতে ব্যবহার করা যেতে পারে৷

আপনি আপনার স্থানীয় মেশিনে , Colab- এ বা Google ক্লাউডে LIT ইনস্টল করতে পারেন। LIT-এর সাথে শুরু করতে, Colab-এ আপনার মডেল এবং একটি সম্পর্কিত ডেটাসেট (যেমন, একটি নিরাপত্তা মূল্যায়ন ডেটাসেট) আমদানি করুন। LIT আপনার মডেল ব্যবহার করে ডেটাসেটের জন্য আউটপুটগুলির একটি সেট তৈরি করবে এবং মডেলের আচরণ অন্বেষণ করার জন্য আপনাকে একটি ব্যবহারকারী ইন্টারফেস প্রদান করবে।

LIT দিয়ে জেমা মডেল বিশ্লেষণ করুন

কোডল্যাব শুরু করুন Google Colab চালু করুন

লার্নিং ইন্টারপ্রিটেবিলিটি টুল (LIT) ইউজার ইন্টারফেসের অ্যানিমেশন

এই ছবিটি LIT এর ইউজার ইন্টারফেস দেখায়। উপরের ডেটাপয়েন্ট এডিটর ব্যবহারকারীদের তাদের প্রম্পট সম্পাদনা করতে দেয়। নীচে, এলএম স্যালিয়েন্স মডিউল তাদের স্যালেন্সি ফলাফলগুলি পরীক্ষা করার অনুমতি দেয়।

জটিল প্রম্পটে ত্রুটি চিহ্নিত করুন

উচ্চ মানের LLM-ভিত্তিক প্রোটোটাইপ এবং অ্যাপ্লিকেশনগুলির জন্য দুটি সবচেয়ে গুরুত্বপূর্ণ প্রম্পটিং কৌশল হল অল্প-শট প্রম্পটিং (প্রম্পটে পছন্দসই আচরণের উদাহরণ সহ) এবং চেইন-অফ-থট , চূড়ান্ত আউটপুটের আগে ব্যাখ্যা বা যুক্তির একটি ফর্ম সহ এলএলএম এর। যাইহোক, একটি কার্যকর প্রম্পট তৈরি করা প্রায়শই এখনও চ্যালেঞ্জিং।

তারা তাদের স্বাদের উপর ভিত্তি করে একটি খাবার পছন্দ করবে কিনা তা মূল্যায়ন করতে সাহায্য করার একটি উদাহরণ বিবেচনা করুন। একটি প্রাথমিক প্রোটোটাইপ চেইন-অফ-থট প্রম্পট-টেমপ্লেট এইরকম দেখতে পারে:

Analyze a menu item in a restaurant.


## For example:


Taste-likes: I've a sweet-tooth
Taste-dislikes: Don't like onions or garlic
Suggestion: Onion soup
Analysis: it has cooked onions in it, which you don't like.
Recommendation: You have to try it.


Taste-likes: I've a sweet-tooth
Taste-dislikes: Don't like onions or garlic
Suggestion: Baguette maison au levain
Analysis: Home-made leaven bread in France is usually great
Recommendation: Likely good.


Taste-likes: I've a sweet-tooth
Taste-dislikes: Don't like onions or garlic
Suggestion: Macaron in France
Analysis: Sweet with many kinds of flavours
Recommendation: You have to try it.


## Now analyse one more example:


Taste-likes: {{users-food-like-preferences}}
Taste-dislikes: {{users-food-dislike-preferences}}
Suggestion: {{menu-item-to-analyse}}
Analysis:

আপনি এই প্রম্পট কোনো সমস্যা স্পট? LIT আপনাকে LM Salience মডিউল দিয়ে প্রম্পট পরীক্ষা করতে সাহায্য করবে।

ডিবাগিংয়ের জন্য সিকোয়েন্স স্যালিয়েন্স ব্যবহার করুন

স্যালিয়েন্সকে সম্ভাব্য ক্ষুদ্রতম স্তরে গণনা করা হয় (অর্থাৎ, প্রতিটি ইনপুট টোকেনের জন্য), কিন্তু LIT টোকেন-সালিয়েন্সকে আরও ব্যাখ্যাযোগ্য বৃহত্তর স্প্যানগুলিতে, যেমন লাইন, বাক্য বা শব্দগুলিতে একত্রিত করতে পারে। আমাদের ইন্টারেক্টিভ স্যালিয়েন্সি এক্সপ্লোরেবল- এ অনাকাঙ্ক্ষিত পক্ষপাতগুলি সনাক্ত করতে এটি কীভাবে ব্যবহার করবেন সে সম্পর্কে আরও জানুন।

প্রম্পট-টেমপ্লেট ভেরিয়েবলের জন্য প্রম্পটকে একটি নতুন উদাহরণ ইনপুট দিয়ে শুরু করা যাক:

{{users-food-like-preferences}} = Cheese
{{users-food-dislike-preferences}} = Can't eat eggs
{{menu-item-to-analyse}} = Quiche Lorraine

একবার এটি সম্পন্ন হলে, একটি আশ্চর্যজনক মডেল সমাপ্তি লক্ষ্য করা যেতে পারে:

Taste-likes: Cheese
Taste-dislikes: Can't eat eggs
Suggestion: Quiche Lorraine
Analysis: A savoury tart with cheese and eggs
Recommendation: You might not like it, but it's worth trying.

কেন মডেল আপনাকে এমন কিছু খাওয়ার পরামর্শ দিচ্ছে যা আপনি স্পষ্টভাবে বলেছেন যে আপনি খেতে পারবেন না?

সিকোয়েন্স স্যালিয়েন্স মূল সমস্যা হাইলাইট করতে সাহায্য করতে পারে, যা আমাদের কয়েকটি-শট উদাহরণে রয়েছে। প্রথম উদাহরণে, বিশ্লেষণ বিভাগে চেইন-অফ-থট যুক্তি চূড়ান্ত সুপারিশের সাথে মেলে না। "এটিতে পেঁয়াজ রান্না করা আছে, যা আপনি পছন্দ করেন না" এর একটি বিশ্লেষণ "আপনাকে এটি চেষ্টা করতে হবে" এর সুপারিশের সাথে যুক্ত করা হয়েছে।

LIT ইউজার ইন্টারফেস প্রম্পট সিকোয়েন্স সেলিয়েন্সি বিশ্লেষণ দেখাচ্ছে

এটি প্রাথমিক প্রম্পটে একটি ত্রুটি হাইলাইট করে: প্রথম কয়েক-শট উদাহরণের জন্য সুপারিশের একটি আকস্মিক অনুলিপি ছিল ( You have to try it! )। আপনি বেগুনি হাইলাইটের অন্ধকার থেকে প্রম্পটে লালন-শক্তি দেখতে পারেন। প্রথম কয়েকটি-শট উদাহরণে এবং বিশেষভাবে Taste-likes , Analysis এবং Recommendation সাথে সম্পর্কিত লাইনগুলিতে সর্বোচ্চ দ্রব্য। এটি পরামর্শ দেয় যে মডেলটি তার চূড়ান্ত ভুল সুপারিশ করতে এই লাইনগুলি সবচেয়ে বেশি ব্যবহার করছে৷

এই উদাহরণটি আরও হাইলাইট করে যে প্রারম্ভিক প্রোটোটাইপিং এমন ঝুঁকিগুলি প্রকাশ করতে পারে যা আপনি সময়ের আগে চিন্তা করতে পারেন না এবং ভাষা মডেলগুলির ত্রুটি-প্রবণ প্রকৃতির মানে হল যে আপনাকে ত্রুটির জন্য সক্রিয়ভাবে ডিজাইন করতে হবে। AI এর সাথে ডিজাইন করার জন্য আমাদের People + AI গাইডবুকে এটি আরও আলোচনা করা হয়েছে।

মডেল আচরণ উন্নত করতে অনুমান পরীক্ষা করুন

LIT আপনাকে একই ইন্টারফেসের মধ্যে প্রম্পটে পরিবর্তনগুলি পরীক্ষা করতে দেয়। এই উদাহরণে, মডেল আচরণ উন্নত করতে একটি সংবিধান যোগ করার চেষ্টা করুন। সংবিধানগুলি মডেলের প্রজন্মকে গাইড করতে সাহায্য করার জন্য নীতিগুলির সাথে নকশা প্রম্পটগুলিকে উল্লেখ করে। সাম্প্রতিক পদ্ধতিগুলি এমনকি সাংবিধানিক নীতিগুলির ইন্টারেক্টিভ ডেরিভেশন সক্ষম করে।

প্রম্পটটিকে আরও উন্নত করতে সাহায্য করার জন্য আসুন এই ধারণাটি ব্যবহার করি। আমাদের প্রম্পটের শীর্ষে প্রজন্মের জন্য নীতিগুলির সাথে একটি বিভাগ যোগ করতে LIT-এর ডেটাপয়েন্ট এডিটর ব্যবহার করুন, যা এখন নিম্নরূপ শুরু হয়:

Analyze a menu item in a restaurant.

* The analysis should be brief and to the point.
* It should provide a clear statement of suitability for someone with
  specific dietary restrictions.
* It should reflect the person's tastes

## For example:

Taste-likes: I've a sweet-tooth
Taste-dislikes: Don't like onions or garlic
Suggestion: Onion soup
Analysis: it has cooked onions in it, which you don't like.
Recommendation: Avoid.

এই আপডেটের সাথে উদাহরণটি পুনরায় চালানো যেতে পারে এবং একটি খুব ভিন্ন আউটপুট পর্যবেক্ষণ করা যেতে পারে:

Taste-likes: Cheese
Taste-dislikes: Can't eat eggs
Suggestion: Quiche Lorraine
Analysis: This dish contains eggs, which you can't eat.
Recommendation: Not suitable for you.

এই পরিবর্তন কেন ঘটছে তা বোঝার জন্য প্রম্পট-স্যালেন্সি পুনরায় পরীক্ষা করা যেতে পারে:

LIT ইউজার ইন্টারফেস প্রম্পট স্যালেন্সি বিশ্লেষণ দেখাচ্ছে

এই উদাহরণে, " আপনার জন্য উপযুক্ত নয় " নীতি দ্বারা প্রভাবিত হচ্ছে " নির্দিষ্ট খাদ্যতালিকাগত সীমাবদ্ধতা সহ কারো জন্য উপযুক্ততার একটি স্পষ্ট বিবৃতি প্রদান করুন " এবং ব্যাখ্যামূলক বিশ্লেষণ বিবৃতি উল্লেখ করে যে থালাটিতে ডিম রয়েছে (তথাকথিত চিন্তা চেইন )

মডেল প্রোবিং এবং অন্বেষণে অ-প্রযুক্তিগত দলগুলিকে অন্তর্ভুক্ত করুন

ব্যাখ্যাযোগ্যতা বলতে বোঝানো হয়েছে একটি দলের প্রচেষ্টা, নীতি, আইনী এবং আরও অনেক কিছু জুড়ে দক্ষতা। আপনি যেমন দেখেছেন, LIT-এর ভিজ্যুয়াল মাধ্যম এবং ইন্টারেক্টিভ দক্ষতা পরীক্ষা করার এবং উদাহরণগুলি অন্বেষণ করার ক্ষমতা বিভিন্ন স্টেকহোল্ডারদের ফলাফলগুলি ভাগ করতে এবং যোগাযোগ করতে সহায়তা করতে পারে। এটি আপনাকে মডেল অন্বেষণ, অনুসন্ধান এবং ডিবাগিংয়ের জন্য সতীর্থদের বিস্তৃত বৈচিত্র্য আনতে সক্ষম করতে পারে। এই প্রযুক্তিগত পদ্ধতিতে তাদের প্রকাশ করা মডেলগুলি কীভাবে কাজ করে সে সম্পর্কে তাদের বোঝার উন্নতি করতে পারে। উপরন্তু, প্রাথমিক মডেল টেস্টিং-এ আরও বৈচিত্র্যময় দক্ষতার সেটও অবাঞ্ছিত ফলাফল উন্মোচন করতে সাহায্য করতে পারে যা উন্নত করা যেতে পারে।

সারসংক্ষেপ

যখন আপনি আপনার মডেল মূল্যায়নে সমস্যাযুক্ত উদাহরণ খুঁজে পান, তখন ডিবাগিংয়ের জন্য সেগুলিকে LIT-এ আনুন৷ কন্টেন্টের সবচেয়ে বড় ইন্দ্রিয়গ্রাহ্য একক বিশ্লেষণ করে শুরু করুন যা আপনি যৌক্তিকভাবে মডেলিং টাস্কের সাথে সম্পর্কিত মনে করতে পারেন, প্রম্পট সামগ্রীতে মডেলটি সঠিকভাবে বা ভুলভাবে কোথায় উপস্থিত হচ্ছে তা দেখতে ভিজ্যুয়ালাইজেশনগুলি ব্যবহার করুন এবং তারপরে আরও ছোট ছোট এককগুলিতে ড্রিল ডাউন করুন সম্ভাব্য সংশোধন সনাক্ত করার জন্য আপনি যে ভুল আচরণটি দেখছেন তা বর্ণনা করুন।

বিকাশকারী সংস্থান