নিরাপত্তা এবং বাস্তবতা নির্দেশিকা

জেনারেটিভ কৃত্রিম বুদ্ধিমত্তার মডেলগুলো শক্তিশালী হাতিয়ার, কিন্তু এগুলোরও সীমাবদ্ধতা রয়েছে। এগুলোর বহুমুখিতা এবং প্রয়োগযোগ্যতার কারণে কখনও কখনও অপ্রত্যাশিত ফলাফল আসতে পারে, যেমন—ভুল, পক্ষপাতদুষ্ট বা আপত্তিকর ফলাফল। এই ধরনের ফলাফল থেকে ক্ষতির ঝুঁকি সীমিত করার জন্য পোস্ট-প্রসেসিং এবং কঠোর ম্যানুয়াল মূল্যায়ন অপরিহার্য।

জেমিনি এপিআই দ্বারা প্রদত্ত মডেলগুলি বিভিন্ন ধরণের জেনারেটিভ এআই এবং ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং (এনএলপি) অ্যাপ্লিকেশনের জন্য ব্যবহার করা যেতে পারে। এই ফাংশনগুলির ব্যবহার শুধুমাত্র জেমিনি এপিআই অথবা গুগল এআই স্টুডিও ওয়েব অ্যাপের মাধ্যমেই করা যায়। আপনার জেমিনি এপিআই ব্যবহার জেনারেটিভ এআই নিষিদ্ধ ব্যবহার নীতি এবং জেমিনি এপিআই পরিষেবার শর্তাবলীর অধীন।

বৃহৎ ভাষা মডেল (এলএলএম)-কে যা এত উপযোগী করে তোলে, তার একটি অংশ হলো এগুলো সৃজনশীল টুল যা বিভিন্ন ধরনের ভাষাগত কাজ সমাধান করতে পারে। দুর্ভাগ্যবশত, এর মানে এও যে, বৃহৎ ভাষা মডেলগুলো এমন আউটপুট তৈরি করতে পারে যা আপনি আশা করেন না, যার মধ্যে আপত্তিকর, অসংবেদনশীল বা তথ্যগতভাবে ভুল টেক্সটও অন্তর্ভুক্ত থাকতে পারে। অধিকন্তু, এই মডেলগুলোর অবিশ্বাস্য বহুমুখিতাই আবার এগুলো ঠিক কী ধরনের অবাঞ্ছিত আউটপুট তৈরি করতে পারে তা সঠিকভাবে অনুমান করা কঠিন করে তোলে। যদিও জেমিনি এপিআই গুগলের এআই নীতিমালা মাথায় রেখে ডিজাইন করা হয়েছে, এই মডেলগুলোকে দায়িত্বের সাথে প্রয়োগ করার দায়ভার ডেভেলপারদের উপরই বর্তায়। ডেভেলপারদের নিরাপদ ও দায়িত্বশীল অ্যাপ্লিকেশন তৈরিতে সহায়তা করার জন্য, জেমিনি এপিআই-তে কিছু বিল্ট-ইন কন্টেন্ট ফিল্টারিং এবং ক্ষতির ৪টি মাত্রার উপর ভিত্তি করে পরিবর্তনযোগ্য সুরক্ষা সেটিংস রয়েছে। আরও জানতে সুরক্ষা সেটিংস গাইডটি দেখুন। এটি তথ্যের নির্ভুলতা উন্নত করার জন্য ‘গ্রাউন্ডিং উইথ গুগল সার্চ’ সুবিধাও প্রদান করে, যদিও যেসব ডেভেলপারের ব্যবহারের ক্ষেত্র তথ্য-অনুসন্ধানমূলক না হয়ে আরও বেশি সৃজনশীল, তারা এটি নিষ্ক্রিয় করতে পারেন।

এই নথিটির উদ্দেশ্য হলো এলএলএম (LLM) ব্যবহারের ক্ষেত্রে উদ্ভূত হতে পারে এমন কিছু নিরাপত্তা ঝুঁকির সাথে আপনাকে পরিচিত করানো এবং উদীয়মান নিরাপত্তা নকশা ও উন্নয়ন সংক্রান্ত সুপারিশসমূহ তুলে ধরা। (উল্লেখ্য যে, আইন ও বিধিমালাও বিধিনিষেধ আরোপ করতে পারে, কিন্তু এই ধরনের বিষয় এই নির্দেশিকার আওতার বাইরে।)

এলএলএম ব্যবহার করে অ্যাপ্লিকেশন তৈরি করার সময় নিম্নলিখিত পদক্ষেপগুলি অনুসরণ করার পরামর্শ দেওয়া হয়:

  • আপনার অ্যাপ্লিকেশনের নিরাপত্তা ঝুঁকিগুলো বোঝা
  • নিরাপত্তা ঝুঁকি প্রশমনের জন্য সমন্বয় বিবেচনা করা হচ্ছে
  • আপনার ব্যবহারের ক্ষেত্রের জন্য উপযুক্ত নিরাপত্তা পরীক্ষা সম্পাদন করা
  • ব্যবহারকারীদের কাছ থেকে মতামত সংগ্রহ করা এবং ব্যবহার পর্যবেক্ষণ করা

আপনার অ্যাপ্লিকেশনের জন্য উপযুক্ত পারফরম্যান্সে না পৌঁছানো পর্যন্ত সমন্বয় এবং পরীক্ষণ পর্যায়গুলো পুনরাবৃত্তিমূলক হওয়া উচিত।

মডেল বাস্তবায়ন চক্র

আপনার অ্যাপ্লিকেশনের নিরাপত্তা ঝুঁকিগুলো বুঝুন

এই প্রেক্ষাপটে, নিরাপত্তাকে একটি ল্যাঙ্গুয়েজ মডেলের (LLM) এমন একটি ক্ষমতা হিসেবে সংজ্ঞায়িত করা হচ্ছে, যা তার ব্যবহারকারীদের ক্ষতি করা থেকে বিরত থাকে, যেমন—ক্ষতিকর ভাষা বা গতানুগতিক ধারণাকে উৎসাহিত করে এমন বিষয়বস্তু তৈরি করা। জেমিনি এপিআই (Gemini API)-এর মাধ্যমে উপলব্ধ মডেলগুলো গুগলের এআই (AI) নীতিমালা মাথায় রেখে ডিজাইন করা হয়েছে এবং আপনার এর ব্যবহার জেনারেটিভ এআই নিষিদ্ধ ব্যবহার নীতির (Generative AI Prohibited Use Policy) অধীন। এপিআই-টি ল্যাঙ্গুয়েজ মডেলের কিছু সাধারণ সমস্যা, যেমন—ক্ষতিকর ভাষা ও বিদ্বেষমূলক বক্তব্য, মোকাবিলা করতে এবং অন্তর্ভুক্তিমূলক পরিবেশ তৈরি ও গতানুগতিক ধারণা পরিহার করার জন্য অন্তর্নির্মিত নিরাপত্তা ফিল্টার সরবরাহ করে। তবে, প্রতিটি অ্যাপ্লিকেশন তার ব্যবহারকারীদের জন্য ভিন্ন ভিন্ন ধরনের ঝুঁকি তৈরি করতে পারে। তাই অ্যাপ্লিকেশনটির মালিক হিসেবে, আপনার ব্যবহারকারীদের সম্পর্কে জানা, আপনার অ্যাপ্লিকেশনটি কী কী সম্ভাব্য ক্ষতি করতে পারে তা বোঝা এবং আপনার অ্যাপ্লিকেশনটি যেন নিরাপদে ও দায়িত্বের সাথে ল্যাঙ্গুয়েজ মডেল ব্যবহার করে তা নিশ্চিত করার দায়িত্ব আপনার।

এই মূল্যায়নের অংশ হিসেবে, ক্ষতির সম্ভাবনা বিবেচনা করা এবং এর গুরুত্ব ও প্রশমনের পদক্ষেপগুলো নির্ধারণ করা উচিত। উদাহরণস্বরূপ, বিনোদনের জন্য কাল্পনিক গল্প তৈরি করে এমন একটি অ্যাপের তুলনায়, বাস্তব ঘটনার উপর ভিত্তি করে প্রবন্ধ তৈরি করে এমন একটি অ্যাপকে ভুল তথ্য এড়ানোর বিষয়ে আরও বেশি সতর্ক থাকতে হবে। সম্ভাব্য নিরাপত্তা ঝুঁকিগুলো খতিয়ে দেখার একটি ভালো উপায় হলো আপনার চূড়ান্ত ব্যবহারকারী এবং আপনার অ্যাপ্লিকেশনের ফলাফলের দ্বারা প্রভাবিত হতে পারে এমন অন্যদের সম্পর্কে গবেষণা করা। এটি বিভিন্ন উপায়ে করা যেতে পারে, যেমন—আপনার অ্যাপের ক্ষেত্রে অত্যাধুনিক গবেষণাগুলো নিয়ে গবেষণা করা, মানুষ কীভাবে একই ধরনের অ্যাপ ব্যবহার করছে তা পর্যবেক্ষণ করা, অথবা ব্যবহারকারী সমীক্ষা, জরিপ চালানো বা সম্ভাব্য ব্যবহারকারীদের সাথে অনানুষ্ঠানিক সাক্ষাৎকার পরিচালনা করা।

উন্নত টিপস

  • আপনার অ্যাপ্লিকেশন এবং এর উদ্দেশ্য সম্পর্কে আপনার লক্ষ্য জনগোষ্ঠীর অন্তর্গত বিভিন্ন ধরনের সম্ভাব্য ব্যবহারকারীদের সাথে কথা বলুন, যাতে সম্ভাব্য ঝুঁকি সম্পর্কে একটি বিস্তৃত ধারণা পাওয়া যায় এবং প্রয়োজন অনুযায়ী বৈচিত্র্যের মানদণ্ড সামঞ্জস্য করা যায়।
  • মার্কিন সরকারের ন্যাশনাল ইনস্টিটিউট অফ স্ট্যান্ডার্ডস অ্যান্ড টেকনোলজি (NIST) কর্তৃক প্রকাশিত এআই ঝুঁকি ব্যবস্থাপনা কাঠামোটি এআই ঝুঁকি ব্যবস্থাপনার জন্য আরও বিস্তারিত নির্দেশনা এবং অতিরিক্ত শিক্ষামূলক উপকরণ সরবরাহ করে।
  • ল্যাঙ্গুয়েজ মডেল থেকে ক্ষতির নৈতিক ও সামাজিক ঝুঁকি বিষয়ে ডিপমাইন্ডের প্রকাশনায়, ল্যাঙ্গুয়েজ মডেল অ্যাপ্লিকেশনগুলো কীভাবে ক্ষতি করতে পারে, তা বিশদভাবে বর্ণনা করা হয়েছে।

নিরাপত্তা ও বাস্তবতার ঝুঁকি প্রশমিত করার জন্য সমন্বয় বিবেচনা করুন।

এখন যেহেতু আপনি ঝুঁকিগুলো সম্পর্কে বুঝতে পেরেছেন, আপনি সেগুলো কীভাবে প্রশমিত করবেন তা স্থির করতে পারেন। কোন ঝুঁকিগুলোকে অগ্রাধিকার দিতে হবে এবং সেগুলো প্রতিরোধের জন্য কতটা চেষ্টা করা উচিত, তা নির্ধারণ করা একটি অত্যন্ত গুরুত্বপূর্ণ সিদ্ধান্ত; এটি অনেকটা একটি সফটওয়্যার প্রকল্পে বাগ বাছাই করার মতোই। একবার অগ্রাধিকারগুলো নির্ধারণ করে ফেললে, আপনি সবচেয়ে উপযুক্ত প্রশমন ব্যবস্থাগুলো নিয়ে ভাবতে শুরু করতে পারেন। প্রায়শই সাধারণ কিছু পরিবর্তনই বড় পার্থক্য গড়ে তুলতে পারে এবং ঝুঁকি কমাতে পারে।

উদাহরণস্বরূপ, একটি অ্যাপ্লিকেশন ডিজাইন করার সময় নিম্নলিখিত বিষয়গুলো বিবেচনা করুন:

  • আপনার অ্যাপ্লিকেশনের প্রেক্ষাপটে যা গ্রহণযোগ্য, তা আরও ভালোভাবে প্রতিফলিত করার জন্য মডেলের আউটপুটকে টিউন করা । এই টিউনিং মডেলের আউটপুটকে আরও অনুমানযোগ্য ও সামঞ্জস্যপূর্ণ করে তুলতে পারে এবং এর ফলে নির্দিষ্ট কিছু ঝুঁকি প্রশমিত করতে সাহায্য করতে পারে।
  • এমন একটি ইনপুট পদ্ধতি প্রদান করা যা আরও নিরাপদ আউটপুট নিশ্চিত করে। আপনি একটি LLM-কে যে সুনির্দিষ্ট ইনপুট দেন, তা আউটপুটের গুণমানে পার্থক্য গড়ে দিতে পারে। আপনার ব্যবহারের ক্ষেত্রে কোনটি সবচেয়ে নিরাপদে কাজ করে তা খুঁজে বের করার জন্য বিভিন্ন ইনপুট প্রম্পট নিয়ে পরীক্ষা-নিরীক্ষা করা সার্থক, কারণ এর মাধ্যমে আপনি এমন একটি ইউজার এক্সপেরিয়েন্স (UX) প্রদান করতে পারবেন যা এটিকে সহজতর করে। উদাহরণস্বরূপ, আপনি ব্যবহারকারীদের শুধুমাত্র ইনপুট প্রম্পটের একটি ড্রপ-ডাউন তালিকা থেকে বেছে নেওয়ার মধ্যে সীমাবদ্ধ রাখতে পারেন, অথবা এমন বর্ণনামূলক বাক্যাংশসহ পপ-আপ সাজেশন দিতে পারেন যা আপনার অ্যাপ্লিকেশনের প্রেক্ষাপটে নিরাপদে কাজ করে বলে আপনি দেখেছেন।
  • ব্যবহারকারীকে দেখানোর আগে অনিরাপদ ইনপুট ব্লক করা এবং আউটপুট ফিল্টার করা। সাধারণ ক্ষেত্রে, প্রম্পট বা উত্তরে থাকা অনিরাপদ শব্দ বা বাক্যাংশ শনাক্ত ও ব্লক করতে ব্লক-লিস্ট ব্যবহার করা যেতে পারে, অথবা মানব পর্যালোচকদের দ্বারা ম্যানুয়ালি এই ধরনের বিষয়বস্তু পরিবর্তন বা ব্লক করার ব্যবস্থা করা যেতে পারে।

  • প্রশিক্ষিত ক্লাসিফায়ার ব্যবহার করে প্রতিটি প্রম্পটকে সম্ভাব্য ক্ষতি বা আক্রমণাত্মক সংকেত দিয়ে চিহ্নিত করা হয়। এরপর, শনাক্ত হওয়া ক্ষতির ধরনের ওপর ভিত্তি করে অনুরোধটি কীভাবে সামলানো হবে, সে বিষয়ে বিভিন্ন কৌশল অবলম্বন করা যেতে পারে। উদাহরণস্বরূপ, যদি ইনপুটটি সুস্পষ্টভাবে আক্রমণাত্মক বা আপত্তিকর প্রকৃতির হয়, তবে সেটিকে ব্লক করে দিয়ে তার পরিবর্তে একটি পূর্ব-নির্ধারিত প্রতিক্রিয়া দেখানো যেতে পারে।

    উন্নত টিপ

    • যদি সংকেতগুলো আউটপুটকে ক্ষতিকর বলে নির্ধারণ করে, তাহলে অ্যাপ্লিকেশনটি নিম্নলিখিত বিকল্পগুলো প্রয়োগ করতে পারে:
      • একটি ত্রুটি বার্তা বা পূর্ব-লিখিত আউটপুট প্রদান করুন।
      • প্রম্পটটি আবার চেষ্টা করুন, যদি কোনো বিকল্প নিরাপদ আউটপুট তৈরি হয়, কারণ কখনও কখনও একই প্রম্পট ভিন্ন ভিন্ন আউটপুট দিতে পারে।

  • ইচ্ছাকৃত অপব্যবহারের বিরুদ্ধে সুরক্ষামূলক ব্যবস্থা গ্রহণ করা, যেমন প্রত্যেক ব্যবহারকারীকে একটি অনন্য আইডি প্রদান করা এবং একটি নির্দিষ্ট সময়কালে জমা দেওয়া ব্যবহারকারী কোয়েরির সংখ্যার উপর সীমা আরোপ করা। আরেকটি সুরক্ষামূলক ব্যবস্থা হলো সম্ভাব্য প্রম্পট ইনজেকশন থেকে রক্ষা করার চেষ্টা করা। প্রম্পট ইনজেকশন, অনেকটা SQL ইনজেকশনের মতোই, ক্ষতিকারক ব্যবহারকারীদের জন্য এমন একটি ইনপুট প্রম্পট ডিজাইন করার একটি উপায় যা মডেলের আউটপুটকে প্রভাবিত করে, উদাহরণস্বরূপ, এমন একটি ইনপুট প্রম্পট পাঠিয়ে যা মডেলকে পূর্ববর্তী যেকোনো উদাহরণ উপেক্ষা করার নির্দেশ দেয়। ইচ্ছাকৃত অপব্যবহার সম্পর্কে বিস্তারিত জানতে জেনারেটিভ এআই নিষিদ্ধ ব্যবহার নীতি দেখুন।

  • কার্যকারিতাকে এমন কিছুর সাথে সামঞ্জস্য করা যা স্বভাবতই কম ঝুঁকিপূর্ণ। যে কাজগুলোর পরিধি সীমিত (যেমন, কোনো লেখা থেকে মূল শব্দ বের করা) অথবা যেগুলোতে মানুষের তত্ত্বাবধান বেশি থাকে (যেমন, সংক্ষিপ্ত আকারের কন্টেন্ট তৈরি করা যা কোনো মানুষ পর্যালোচনা করবে), সেগুলোতে প্রায়শই ঝুঁকি কম থাকে। তাই উদাহরণস্বরূপ, একেবারে নতুন করে একটি ইমেলের উত্তর লেখার জন্য অ্যাপ্লিকেশন তৈরি করার পরিবর্তে, আপনি এটিকে কোনো রূপরেখা বিস্তারিত করা বা বিকল্প শব্দচয়ন প্রস্তাব করার মধ্যে সীমাবদ্ধ রাখতে পারেন।

  • ক্ষতিকর প্রতিক্রিয়া দেখার সম্ভাবনা কমাতে ক্ষতিকর কন্টেন্ট সুরক্ষা সেটিংস সামঞ্জস্য করুন। জেমিনি এপিআই এমন সুরক্ষা সেটিংস প্রদান করে যা আপনি প্রোটোটাইপিং পর্যায়ে সামঞ্জস্য করতে পারেন, যার মাধ্যমে নির্ধারণ করা যায় আপনার অ্যাপ্লিকেশনের জন্য আরও কঠোর বা কম কঠোর সুরক্ষা কনফিগারেশন প্রয়োজন কিনা। নির্দিষ্ট ধরণের কন্টেন্ট সীমাবদ্ধ বা অনুমোদন করতে আপনি পাঁচটি ফিল্টার ক্যাটাগরিতে এই সেটিংস সামঞ্জস্য করতে পারেন। জেমিনি এপিআই-এর মাধ্যমে উপলব্ধ সামঞ্জস্যযোগ্য সুরক্ষা সেটিংস সম্পর্কে জানতে সুরক্ষা সেটিংস গাইডটি দেখুন।

  • ‘গ্রাউন্ডিং উইথ গুগল সার্চ’ সক্রিয় করার মাধ্যমে সম্ভাব্য তথ্যগত ভুল বা বিভ্রম হ্রাস করুন । মনে রাখবেন, অনেক এআই মডেল পরীক্ষামূলক এবং সেগুলো তথ্যগতভাবে ভুল তথ্য উপস্থাপন করতে পারে, বিভ্রম ঘটাতে পারে, বা অন্য কোনোভাবে সমস্যাযুক্ত ফলাফল তৈরি করতে পারে। ‘গ্রাউন্ডিং উইথ গুগল সার্চ’ ফিচারটি জেমিনি মডেলকে রিয়েল-টাইম ওয়েব কন্টেন্টের সাথে সংযুক্ত করে এবং সমস্ত উপলব্ধ ভাষায় কাজ করে। এটি জেমিনিকে আরও নির্ভুল উত্তর প্রদান করতে এবং মডেলের জ্ঞানসীমার বাইরেও যাচাইযোগ্য উৎস উল্লেখ করতে সক্ষম করে।

আপনার ব্যবহারের ক্ষেত্র অনুযায়ী উপযুক্ত নিরাপত্তা পরীক্ষা সম্পাদন করুন।

শক্তিশালী এবং নিরাপদ অ্যাপ্লিকেশন তৈরির একটি গুরুত্বপূর্ণ অংশ হলো টেস্টিং, কিন্তু টেস্টিংয়ের ব্যাপ্তি, পরিধি এবং কৌশল ভিন্ন ভিন্ন হতে পারে। উদাহরণস্বরূপ, নিছক মজার জন্য তৈরি একটি হাইকু জেনারেটরের ঝুঁকি, আইন সংস্থাগুলোর আইনি নথির সারসংক্ষেপ তৈরি এবং চুক্তিপত্রে সাহায্য করার জন্য ডিজাইন করা একটি অ্যাপ্লিকেশনের ঝুঁকির চেয়ে কম হওয়ার সম্ভাবনা থাকে। কিন্তু হাইকু জেনারেটরটি বিভিন্ন ধরনের ব্যবহারকারী ব্যবহার করতে পারেন, যার ফলে প্রতিকূল প্রচেষ্টা বা এমনকি অনিচ্ছাকৃত ক্ষতিকর ইনপুটের সম্ভাবনা বেশি হতে পারে। বাস্তবায়নের প্রেক্ষাপটও একটি গুরুত্বপূর্ণ বিষয়। যেমন, কোনো পদক্ষেপ নেওয়ার আগে মানব বিশেষজ্ঞদের দ্বারা আউটপুট পর্যালোচনা করা হয় এমন একটি অ্যাপ্লিকেশনকে, এই ধরনের তত্ত্বাবধান ছাড়া একই রকম অ্যাপ্লিকেশনের তুলনায়, ক্ষতিকর আউটপুট তৈরির সম্ভাবনা কম বলে মনে করা হতে পারে।

এমনকি তুলনামূলকভাবে কম ঝুঁকিপূর্ণ অ্যাপ্লিকেশনগুলোর ক্ষেত্রেও, লঞ্চ করার জন্য প্রস্তুত বলে আত্মবিশ্বাসী হওয়ার আগে বেশ কয়েকবার পরিবর্তন ও পরীক্ষা-নিরীক্ষার মধ্য দিয়ে যাওয়াটা অস্বাভাবিক নয়। এআই অ্যাপ্লিকেশনগুলোর জন্য দুই ধরনের পরীক্ষা বিশেষভাবে উপযোগী:

  • সেফটি বেঞ্চমার্কিং-এর মধ্যে রয়েছে এমন সেফটি মেট্রিকস ডিজাইন করা, যা আপনার অ্যাপ্লিকেশনটি যেভাবে ব্যবহৃত হওয়ার সম্ভাবনা রয়েছে তার প্রেক্ষাপটে এটি কোন কোন উপায়ে অনিরাপদ হতে পারে তা প্রতিফলিত করে, এবং তারপর ইভ্যালুয়েশন ডেটাসেট ব্যবহার করে সেই মেট্রিকসগুলোর উপর আপনার অ্যাপ্লিকেশনটি কতটা ভালো পারফর্ম করে তা পরীক্ষা করা। পরীক্ষা করার আগে সেফটি মেট্রিকসের ন্যূনতম গ্রহণযোগ্য স্তরগুলো নিয়ে চিন্তা করা একটি ভালো অভ্যাস, যাতে ১) আপনি সেই প্রত্যাশাগুলোর সাথে পরীক্ষার ফলাফল তুলনা করে মূল্যায়ন করতে পারেন এবং ২) আপনার সবচেয়ে গুরুত্বপূর্ণ মেট্রিকসগুলো মূল্যায়নকারী পরীক্ষাগুলোর উপর ভিত্তি করে ইভ্যালুয়েশন ডেটাসেট সংগ্রহ করতে পারেন।

    উন্নত টিপস

    • তৈরি পদ্ধতির উপর অতিরিক্ত নির্ভর করা থেকে সাবধান থাকুন, কারণ আপনার অ্যাপ্লিকেশনের প্রেক্ষাপটের সাথে পুরোপুরি মানানসই করার জন্য মানব মূল্যায়নকারীদের ব্যবহার করে নিজস্ব টেস্টিং ডেটাসেট তৈরি করার প্রয়োজন হতে পারে।
    • আপনার যদি একাধিক মেট্রিক থাকে, তবে কোনো পরিবর্তনের ফলে একটি মেট্রিকের উন্নতি হলেও যদি অন্যটির ক্ষতি হয়, তাহলে আপনাকে সিদ্ধান্ত নিতে হবে যে আপনি কীভাবে সমন্বয় করবেন। অন্যান্য পারফরম্যান্স ইঞ্জিনিয়ারিংয়ের মতোই, আপনি গড় পারফরম্যান্সের পরিবর্তে আপনার মূল্যায়ন সেটের সবচেয়ে খারাপ পারফরম্যান্সের উপর মনোযোগ দিতে চাইতে পারেন।
  • অ্যাডভার্সারিয়াল টেস্টিং- এর মাধ্যমে সক্রিয়ভাবে আপনার অ্যাপ্লিকেশনটিকে অকার্যকর করার চেষ্টা করা হয়। এর লক্ষ্য হলো দুর্বলতার জায়গাগুলো চিহ্নিত করা, যাতে আপনি প্রয়োজন অনুযায়ী সেগুলোর প্রতিকারের জন্য পদক্ষেপ নিতে পারেন। আপনার অ্যাপ্লিকেশনে বিশেষজ্ঞ মূল্যায়নকারীদের কাছ থেকে অ্যাডভার্সারিয়াল টেস্টিং-এর জন্য যথেষ্ট সময় ও শ্রমের প্রয়োজন হতে পারে — কিন্তু আপনি যত বেশি এটি করবেন, সমস্যা খুঁজে পাওয়ার সম্ভাবনা তত বাড়বে, বিশেষ করে সেই সমস্যাগুলো যেগুলো খুব কমই দেখা যায় অথবা অ্যাপ্লিকেশনটি বারবার চালানোর পরেই কেবল ঘটে।

    • অ্যাডভার্সারিয়াল টেস্টিং হলো একটি এমএল মডেলকে পদ্ধতিগতভাবে মূল্যায়ন করার একটি পদ্ধতি, যার উদ্দেশ্য হলো ক্ষতিকর বা অনিচ্ছাকৃতভাবে ক্ষতিকারক ইনপুট পেলে মডেলটি কীভাবে আচরণ করে তা জানা।
      • কোনো ইনপুট ক্ষতিকর হতে পারে যখন সেটি একটি অনিরাপদ বা ক্ষতিকর আউটপুট তৈরি করার জন্য স্পষ্টভাবে পরিকল্পিত হয়—উদাহরণস্বরূপ, একটি টেক্সট জেনারেশন মডেলকে কোনো নির্দিষ্ট ধর্ম সম্পর্কে বিদ্বেষপূর্ণ বক্তব্য তৈরি করতে বলা।
      • কোনো ইনপুটকে অনিচ্ছাকৃতভাবে ক্ষতিকর বলা হয় যখন ইনপুটটি নিজে নিরীহ হলেও ক্ষতিকর আউটপুট তৈরি করে — উদাহরণস্বরূপ, একটি টেক্সট জেনারেশন মডেলকে কোনো নির্দিষ্ট জাতিগোষ্ঠীর ব্যক্তির বর্ণনা দিতে বললে বর্ণবাদী আউটপুট পাওয়া।
    • একটি অ্যাডভার্সারিয়াল টেস্টকে একটি সাধারণ মূল্যায়ন থেকে যা আলাদা করে, তা হলো পরীক্ষার জন্য ব্যবহৃত ডেটার গঠন। অ্যাডভার্সারিয়াল টেস্টের জন্য এমন টেস্ট ডেটা নির্বাচন করুন যা মডেল থেকে সমস্যাযুক্ত আউটপুট বের করে আনার সম্ভাবনা সবচেয়ে বেশি। এর অর্থ হলো, মডেলের আচরণকে সম্ভাব্য সব ধরনের ক্ষতির জন্য পরীক্ষা করা, যার মধ্যে বিরল বা অস্বাভাবিক উদাহরণ এবং নিরাপত্তা নীতির সাথে প্রাসঙ্গিক এজ-কেসও অন্তর্ভুক্ত। এতে একটি বাক্যের বিভিন্ন দিক, যেমন—গঠন, অর্থ এবং দৈর্ঘ্যের ক্ষেত্রেও বৈচিত্র্য থাকা উচিত। একটি টেস্ট ডেটাসেট তৈরি করার সময় কী কী বিষয় বিবেচনা করতে হবে, সে সম্পর্কে আরও বিস্তারিত জানতে আপনি Google-এর 'Responsible AI practices in fairness' দেখতে পারেন।

      উন্নত টিপস

      • আপনার অ্যাপ্লিকেশনটি ভাঙার চেষ্টা করার জন্য 'রেড টিম'-এ লোক নিয়োগ করার প্রচলিত পদ্ধতির পরিবর্তে স্বয়ংক্রিয় টেস্টিং ব্যবহার করুন। স্বয়ংক্রিয় টেস্টিং-এ, 'রেড টিম' হলো আরেকটি ল্যাঙ্গুয়েজ মডেল যা এমন ইনপুট টেক্সট খুঁজে বের করে, যা পরীক্ষাধীন মডেলটি থেকে ক্ষতিকর আউটপুট তৈরি করে।

সমস্যার জন্য পর্যবেক্ষণ করুন

আপনি যতই পরীক্ষা-নিরীক্ষা ও প্রতিকারমূলক ব্যবস্থা গ্রহণ করুন না কেন, নিখুঁত হওয়ার নিশ্চয়তা কখনোই দেওয়া যায় না। তাই, উদ্ভূত সমস্যাগুলো কীভাবে চিহ্নিত ও মোকাবিলা করবেন, তা আগে থেকেই পরিকল্পনা করে রাখুন। প্রচলিত পদ্ধতিগুলোর মধ্যে রয়েছে ব্যবহারকারীদের মতামত জানানোর জন্য একটি পর্যবেক্ষণাধীন চ্যানেল স্থাপন করা (যেমন, ভালো বা খারাপ রেটিং) এবং বিভিন্ন ধরনের ব্যবহারকারীর কাছ থেকে সক্রিয়ভাবে মতামত সংগ্রহের জন্য একটি ব্যবহারকারী সমীক্ষা চালানো—যা বিশেষত মূল্যবান, যদি ব্যবহারের ধরণ প্রত্যাশার চেয়ে ভিন্ন হয়।

উন্নত টিপস

  • যখন ব্যবহারকারীরা এআই পণ্যগুলিতে মতামত দেন, তখন তা সময়ের সাথে সাথে এআই-এর কর্মক্ষমতা এবং ব্যবহারকারীর অভিজ্ঞতাকে ব্যাপকভাবে উন্নত করতে পারে; উদাহরণস্বরূপ, এটি আপনাকে প্রম্পট টিউনিংয়ের জন্য আরও ভালো উদাহরণ বেছে নিতে সাহায্য করে। গুগলের 'পিপল অ্যান্ড এআই' গাইডবুকের ' ফিডব্যাক অ্যান্ড কন্ট্রোল' অধ্যায়ে ফিডব্যাক ব্যবস্থা ডিজাইন করার সময় বিবেচ্য মূল বিষয়গুলো তুলে ধরা হয়েছে।

পরবর্তী পদক্ষেপ