যদিও এআই-এর জন্য একটি দায়িত্বশীল পদ্ধতির মধ্যে নিরাপত্তা নীতি, মডেলের নিরাপত্তা উন্নত করার কৌশল, কীভাবে স্বচ্ছতা শিল্পকর্ম তৈরি করা যায়, জেনারেটিভ এআই-এর সাথে দায়িত্বশীল হওয়ার জন্য আপনার দৃষ্টিভঙ্গি কেবল একটি চেকলিস্ট অনুসরণ করা উচিত নয়। জেনারেটিভ এআই পণ্যগুলি তুলনামূলকভাবে নতুন এবং একটি অ্যাপ্লিকেশনের আচরণগুলি সফ্টওয়্যারের আগের ফর্মগুলির চেয়ে বেশি পরিবর্তিত হতে পারে। এই কারণে, আপনার ব্যবহৃত মেশিন লার্নিং মডেলগুলি পরীক্ষা করা উচিত, মডেলের আচরণের উদাহরণগুলি পরীক্ষা করা এবং বিস্ময়ের তদন্ত করা উচিত।
আজ, প্রম্পট করা বিজ্ঞানের মতোই শিল্প, কিন্তু এমন সরঞ্জাম রয়েছে যা আপনাকে বৃহৎ ভাষার মডেলগুলির জন্য প্রম্পটগুলিকে অভিজ্ঞতাগতভাবে উন্নত করতে সাহায্য করতে পারে, যেমন লার্নিং ইন্টারপ্রেটেবিলিটি টুল (LIT) ৷ LIT হল একটি ওপেন সোর্স প্ল্যাটফর্ম যা AI/ML মডেলগুলিকে ভিজ্যুয়ালাইজ, বোঝা এবং ডিবাগ করার জন্য তৈরি করা হয়েছে। নিচে একটি উদাহরণ দেওয়া হল কিভাবে LIT-কে Gemma-এর আচরণ অন্বেষণ করতে, সম্ভাব্য সমস্যাগুলি অনুমান করতে এবং এর নিরাপত্তার উন্নতি করতে ব্যবহার করা যেতে পারে৷
আপনি আপনার স্থানীয় মেশিনে , Colab- এ বা Google ক্লাউডে LIT ইনস্টল করতে পারেন। LIT-এর সাথে শুরু করতে, Colab-এ আপনার মডেল এবং একটি সম্পর্কিত ডেটাসেট (যেমন, একটি নিরাপত্তা মূল্যায়ন ডেটাসেট) আমদানি করুন। LIT আপনার মডেল ব্যবহার করে ডেটাসেটের জন্য আউটপুটগুলির একটি সেট তৈরি করবে এবং মডেলের আচরণ অন্বেষণ করার জন্য আপনাকে একটি ব্যবহারকারী ইন্টারফেস প্রদান করবে।
LIT দিয়ে জেমা মডেল বিশ্লেষণ করুন
কোডল্যাব শুরু করুন | Google Colab চালু করুন |
এই ছবিটি LIT এর ইউজার ইন্টারফেস দেখায়। উপরের ডেটাপয়েন্ট এডিটর ব্যবহারকারীদের তাদের প্রম্পট সম্পাদনা করতে দেয়। নীচে, এলএম স্যালিয়েন্স মডিউল তাদের স্যালেন্সি ফলাফলগুলি পরীক্ষা করার অনুমতি দেয়।
জটিল প্রম্পটে ত্রুটি চিহ্নিত করুন
উচ্চ মানের LLM-ভিত্তিক প্রোটোটাইপ এবং অ্যাপ্লিকেশনগুলির জন্য দুটি সবচেয়ে গুরুত্বপূর্ণ প্রম্পটিং কৌশল হল অল্প-শট প্রম্পটিং (প্রম্পটে পছন্দসই আচরণের উদাহরণ সহ) এবং চেইন-অফ-থট , চূড়ান্ত আউটপুটের আগে ব্যাখ্যা বা যুক্তির একটি ফর্ম সহ এলএলএম এর। যাইহোক, একটি কার্যকর প্রম্পট তৈরি করা প্রায়শই এখনও চ্যালেঞ্জিং।
তারা তাদের স্বাদের উপর ভিত্তি করে একটি খাবার পছন্দ করবে কিনা তা মূল্যায়ন করতে সাহায্য করার একটি উদাহরণ বিবেচনা করুন। একটি প্রাথমিক প্রোটোটাইপ চেইন-অফ-থট প্রম্পট-টেমপ্লেট এইরকম দেখতে পারে:
Analyze a menu item in a restaurant. ## For example: Taste-likes: I've a sweet-tooth Taste-dislikes: Don't like onions or garlic Suggestion: Onion soup Analysis: it has cooked onions in it, which you don't like. Recommendation: You have to try it. Taste-likes: I've a sweet-tooth Taste-dislikes: Don't like onions or garlic Suggestion: Baguette maison au levain Analysis: Home-made leaven bread in France is usually great Recommendation: Likely good. Taste-likes: I've a sweet-tooth Taste-dislikes: Don't like onions or garlic Suggestion: Macaron in France Analysis: Sweet with many kinds of flavours Recommendation: You have to try it. ## Now analyse one more example: Taste-likes: {{users-food-like-preferences}} Taste-dislikes: {{users-food-dislike-preferences}} Suggestion: {{menu-item-to-analyse}} Analysis:
আপনি এই প্রম্পট কোনো সমস্যা স্পট? LIT আপনাকে LM Salience মডিউল দিয়ে প্রম্পট পরীক্ষা করতে সাহায্য করবে।
ডিবাগিংয়ের জন্য সিকোয়েন্স স্যালিয়েন্স ব্যবহার করুন
স্যালিয়েন্সকে সম্ভাব্য ক্ষুদ্রতম স্তরে গণনা করা হয় (অর্থাৎ, প্রতিটি ইনপুট টোকেনের জন্য), কিন্তু LIT টোকেন-সালিয়েন্সকে আরও ব্যাখ্যাযোগ্য বৃহত্তর স্প্যানগুলিতে, যেমন লাইন, বাক্য বা শব্দগুলিতে একত্রিত করতে পারে। আমাদের ইন্টারেক্টিভ স্যালিয়েন্সি এক্সপ্লোরেবল- এ অনাকাঙ্ক্ষিত পক্ষপাতগুলি সনাক্ত করতে এটি কীভাবে ব্যবহার করবেন সে সম্পর্কে আরও জানুন।
প্রম্পট-টেমপ্লেট ভেরিয়েবলের জন্য প্রম্পটকে একটি নতুন উদাহরণ ইনপুট দিয়ে শুরু করা যাক:
{{users-food-like-preferences}} = Cheese {{users-food-dislike-preferences}} = Can't eat eggs {{menu-item-to-analyse}} = Quiche Lorraine
একবার এটি সম্পন্ন হলে, একটি আশ্চর্যজনক মডেল সমাপ্তি লক্ষ্য করা যেতে পারে:
Taste-likes: Cheese Taste-dislikes: Can't eat eggs Suggestion: Quiche Lorraine Analysis: A savoury tart with cheese and eggs Recommendation: You might not like it, but it's worth trying.
কেন মডেল আপনাকে এমন কিছু খাওয়ার পরামর্শ দিচ্ছে যা আপনি স্পষ্টভাবে বলেছেন যে আপনি খেতে পারবেন না?
সিকোয়েন্স স্যালিয়েন্স মূল সমস্যা হাইলাইট করতে সাহায্য করতে পারে, যা আমাদের কয়েকটি-শট উদাহরণে রয়েছে। প্রথম উদাহরণে, বিশ্লেষণ বিভাগে চেইন-অফ-থট যুক্তি চূড়ান্ত সুপারিশের সাথে মেলে না। "এটিতে পেঁয়াজ রান্না করা আছে, যা আপনি পছন্দ করেন না" এর একটি বিশ্লেষণ "আপনাকে এটি চেষ্টা করতে হবে" এর সুপারিশের সাথে যুক্ত করা হয়েছে।
এটি প্রাথমিক প্রম্পটে একটি ত্রুটি হাইলাইট করে: প্রথম কয়েক-শট উদাহরণের জন্য সুপারিশের একটি আকস্মিক অনুলিপি ছিল ( You have to try it!
)। আপনি বেগুনি হাইলাইটের অন্ধকার থেকে প্রম্পটে লালন-শক্তি দেখতে পারেন। প্রথম কয়েকটি-শট উদাহরণে এবং বিশেষভাবে Taste-likes
, Analysis
এবং Recommendation
সাথে সম্পর্কিত লাইনগুলিতে সর্বোচ্চ দ্রব্য। এটি পরামর্শ দেয় যে মডেলটি তার চূড়ান্ত ভুল সুপারিশ করতে এই লাইনগুলি সবচেয়ে বেশি ব্যবহার করছে৷
এই উদাহরণটি আরও হাইলাইট করে যে প্রারম্ভিক প্রোটোটাইপিং এমন ঝুঁকিগুলি প্রকাশ করতে পারে যা আপনি সময়ের আগে চিন্তা করতে পারেন না এবং ভাষা মডেলগুলির ত্রুটি-প্রবণ প্রকৃতির মানে হল যে আপনাকে ত্রুটির জন্য সক্রিয়ভাবে ডিজাইন করতে হবে। AI এর সাথে ডিজাইন করার জন্য আমাদের People + AI গাইডবুকে এটি আরও আলোচনা করা হয়েছে।
মডেল আচরণ উন্নত করতে অনুমান পরীক্ষা করুন
LIT আপনাকে একই ইন্টারফেসের মধ্যে প্রম্পটে পরিবর্তনগুলি পরীক্ষা করতে দেয়। এই উদাহরণে, মডেল আচরণ উন্নত করতে একটি সংবিধান যোগ করার চেষ্টা করুন। সংবিধানগুলি মডেলের প্রজন্মকে গাইড করতে সাহায্য করার জন্য নীতিগুলির সাথে নকশা প্রম্পটগুলিকে উল্লেখ করে। সাম্প্রতিক পদ্ধতিগুলি এমনকি সাংবিধানিক নীতিগুলির ইন্টারেক্টিভ ডেরিভেশন সক্ষম করে।
প্রম্পটটিকে আরও উন্নত করতে সাহায্য করার জন্য আসুন এই ধারণাটি ব্যবহার করি। আমাদের প্রম্পটের শীর্ষে প্রজন্মের জন্য নীতিগুলির সাথে একটি বিভাগ যোগ করতে LIT-এর ডেটাপয়েন্ট এডিটর ব্যবহার করুন, যা এখন নিম্নরূপ শুরু হয়:
Analyze a menu item in a restaurant. * The analysis should be brief and to the point. * It should provide a clear statement of suitability for someone with specific dietary restrictions. * It should reflect the person's tastes ## For example: Taste-likes: I've a sweet-tooth Taste-dislikes: Don't like onions or garlic Suggestion: Onion soup Analysis: it has cooked onions in it, which you don't like. Recommendation: Avoid.
এই আপডেটের সাথে উদাহরণটি পুনরায় চালানো যেতে পারে এবং একটি খুব ভিন্ন আউটপুট পর্যবেক্ষণ করা যেতে পারে:
Taste-likes: Cheese Taste-dislikes: Can't eat eggs Suggestion: Quiche Lorraine Analysis: This dish contains eggs, which you can't eat. Recommendation: Not suitable for you.
এই পরিবর্তন কেন ঘটছে তা বোঝার জন্য প্রম্পট-স্যালেন্সি পুনরায় পরীক্ষা করা যেতে পারে:
এই উদাহরণে, " আপনার জন্য উপযুক্ত নয় " নীতি দ্বারা প্রভাবিত হচ্ছে " নির্দিষ্ট খাদ্যতালিকাগত সীমাবদ্ধতা সহ কারো জন্য উপযুক্ততার একটি স্পষ্ট বিবৃতি প্রদান করুন " এবং ব্যাখ্যামূলক বিশ্লেষণ বিবৃতি উল্লেখ করে যে থালাটিতে ডিম রয়েছে (তথাকথিত চিন্তা চেইন )
মডেল প্রোবিং এবং অন্বেষণে অ-প্রযুক্তিগত দলগুলিকে অন্তর্ভুক্ত করুন
ব্যাখ্যাযোগ্যতা বলতে বোঝানো হয়েছে একটি দলের প্রচেষ্টা, নীতি, আইনী এবং আরও অনেক কিছু জুড়ে দক্ষতা। আপনি যেমন দেখেছেন, LIT-এর ভিজ্যুয়াল মাধ্যম এবং ইন্টারেক্টিভ দক্ষতা পরীক্ষা করার এবং উদাহরণগুলি অন্বেষণ করার ক্ষমতা বিভিন্ন স্টেকহোল্ডারদের ফলাফলগুলি ভাগ করতে এবং যোগাযোগ করতে সহায়তা করতে পারে। এটি আপনাকে মডেল অন্বেষণ, অনুসন্ধান এবং ডিবাগিংয়ের জন্য সতীর্থদের বিস্তৃত বৈচিত্র্য আনতে সক্ষম করতে পারে। এই প্রযুক্তিগত পদ্ধতিতে তাদের প্রকাশ করা মডেলগুলি কীভাবে কাজ করে সে সম্পর্কে তাদের বোঝার উন্নতি করতে পারে। উপরন্তু, প্রাথমিক মডেল টেস্টিং-এ আরও বৈচিত্র্যময় দক্ষতার সেটও অবাঞ্ছিত ফলাফল উন্মোচন করতে সাহায্য করতে পারে যা উন্নত করা যেতে পারে।
সারসংক্ষেপ
যখন আপনি আপনার মডেল মূল্যায়নে সমস্যাযুক্ত উদাহরণ খুঁজে পান, তখন ডিবাগিংয়ের জন্য সেগুলিকে LIT-এ আনুন৷ কন্টেন্টের সবচেয়ে বড় ইন্দ্রিয়গ্রাহ্য একক বিশ্লেষণ করে শুরু করুন যা আপনি যৌক্তিকভাবে মডেলিং টাস্কের সাথে সম্পর্কিত মনে করতে পারেন, প্রম্পট সামগ্রীতে মডেলটি সঠিকভাবে বা ভুলভাবে কোথায় উপস্থিত হচ্ছে তা দেখতে ভিজ্যুয়ালাইজেশনগুলি ব্যবহার করুন এবং তারপরে আরও ছোট ছোট এককগুলিতে ড্রিল ডাউন করুন সম্ভাব্য সংশোধন সনাক্ত করার জন্য আপনি যে ভুল আচরণটি দেখছেন তা বর্ণনা করুন।
বিকাশকারী সংস্থান
- LIT ওয়েবসাইট
- এআই দিয়ে ডিজাইন করার জন্য মানুষ + এআই গাইডবুক