जोखिमों का आकलन करें और सुरक्षा नीतियां सेट करें

कॉन्टेंट की सुरक्षा से जुड़ी नीतियों में यह बताया गया है कि किसी ऑनलाइन प्लैटफ़ॉर्म पर किस तरह का नुकसान पहुंचाने वाला कॉन्टेंट दिखाने की अनुमति नहीं है. आपको YouTube या Google Play जैसे प्लैटफ़ॉर्म की कॉन्टेंट की नीतियों के बारे में जानकारी हो सकती है. जनरेटिव एआई ऐप्लिकेशन के लिए, कॉन्टेंट की नीतियां एक जैसी होती हैं: इनसे तय होता है कि आपके ऐप्लिकेशन को किस तरह का कॉन्टेंट जनरेट नहीं करना चाहिए. इनसे मॉडल को बेहतर बनाने का तरीका पता चलता है और सुरक्षा के कौनसे उपाय जोड़े जाने चाहिए.

आपकी नीतियों में आपके ऐप्लिकेशन के इस्तेमाल के उदाहरण की जानकारी होनी चाहिए. उदाहरण के लिए, कम्यूनिटी के सुझावों के आधार पर, परिवार से जुड़ी गतिविधियों के लिए आइडिया देने वाले जनरेटिव एआई प्रॉडक्ट की नीति हो सकती है. इसमें हिंसक कॉन्टेंट को जनरेट करने पर पाबंदी लगाई जा सकती है, क्योंकि इससे उपयोगकर्ताओं को नुकसान पहुंच सकता है. ठीक इसके उलट, ऐसा ऐप्लिकेशन जो साइंस फ़िक्शन की कहानियों के बारे में कम शब्दों में बताने वाला ऐसा ऐप्लिकेशन चाहे, जो हिंसा पैदा करने की अनुमति दे, क्योंकि यह इस शैली की कई कहानियों का विषय है.

आपकी सुरक्षा नीतियों में ऐसे कॉन्टेंट को जनरेट करने की अनुमति नहीं होनी चाहिए जो लोगों को नुकसान पहुंचाने वाला या गैर-कानूनी हो. साथ ही, उसमें यह बताया जाना चाहिए कि आपके ऐप्लिकेशन के लिए किस तरह का कॉन्टेंट जनरेट किया गया है. इसके अलावा, शिक्षा, डॉक्यूमेंट्री, विज्ञान या कला के मकसद से बनाए गए ऐसे कॉन्टेंट को अपवाद के तौर पर शामिल किया जा सकता है जिसे नुकसान पहुंचाने वाला माना जा सकता है.

ज़िम्मेदारी के साथ प्रॉडक्ट बनाने के लिए, ज़रूरी है कि नीतियों को विस्तार से और विस्तार से समझाया जाए. इनमें नीति से जुड़े अपवाद भी शामिल हैं. आपकी नीतियों का इस्तेमाल, मॉडल बनाने के हर चरण में किया जाता है. डेटा को साफ़ करने या लेबल करने के मामले में, गलत लेबल वाले डेटा, ज़रूरत से ज़्यादा हटाए जाने या कम डेटा हटाए जाने की वजह से आपके मॉडल की सुरक्षा पर असर पड़ सकता है. आकलन के मकसद से, गलत ढंग से तय की गई नीतियों से इंटर-रेटर में ज़्यादा अंतर हो सकता है. इससे यह पता लगाना मुश्किल हो जाएगा कि आपका मॉडल आपके सुरक्षा मानकों को पूरा करता है या नहीं.

काल्पनिक नीतियां (सिर्फ़ उदाहरण के लिए)

यहां कुछ ऐसी नीतियों के उदाहरण दिए गए हैं जिन्हें अपने ऐप्लिकेशन में इस्तेमाल किया जा सकता है. हालांकि, इसके लिए ज़रूरी है कि वे आपके इस्तेमाल के उदाहरण से मेल खाती हों.

नीति की कैटगरी नीति
व्यक्तिगत पहचान ज़ाहिर करने वाली संवेदनशील जानकारी (एसपीआईआई) ऐप्लिकेशन, संवेदनशील और व्यक्तिगत पहचान से जुड़ी जानकारी (जैसे कि ईमेल, क्रेडिट कार्ड नंबर या किसी व्यक्ति का सोशल सिक्योरिटी नंबर) नहीं सुनाएगा.
नफ़रत फैलाने वाली भाषा ऐप्लिकेशन, किसी पहचान और/या सुरक्षित एट्रिब्यूट को टारगेट करने वाला नेगेटिव या नुकसान पहुंचाने वाला कॉन्टेंट जनरेट नहीं करेगा. जैसे, नस्लीय टिप्पणियां, भेदभाव को बढ़ावा देना, सुरक्षित ग्रुप के ख़िलाफ़ हिंसा के लिए उकसाना.
उत्पीड़न ऐप्लिकेशन में किसी दूसरे व्यक्ति को टारगेट करने वाला नुकसान पहुंचाने वाला, डराने-धमकाने वाला या बुरे बर्ताव वाला कॉन्टेंट नहीं बनाया जाएगा. जैसे, शारीरिक धमकियां, दुखद घटनाओं से इनकार, हिंसा के पीड़ितों का अपमान करना.
खतरनाक कॉन्टेंट इस ऐप्लिकेशन में खुद को और/या दूसरों को नुकसान पहुंचाने के बारे में निर्देश या सलाह नहीं दी जाएगी. जैसे, बंदूकों और विस्फोटक डिवाइसों को ऐक्सेस करने या बनाने, आतंकवाद को बढ़ावा देने, आत्महत्या के निर्देश देने के बारे में नहीं.
सेक्शुअल ऐक्ट दिखाने वाला कॉन्टेंट ऐप्लिकेशन ऐसा कॉन्टेंट जनरेट नहीं करेगा जिसमें सेक्शुअल ऐक्ट या अन्य भद्दा कॉन्टेंट का रेफ़रंस हो. जैसे, सेक्शुअल ऐक्ट दिल दहलाने वाला कॉन्टेंट, उत्तेजित करने के मकसद से बनाया गया कॉन्टेंट.
नुकसान पहुंचाने वाले सामान और सेवाओं का ऐक्सेस देना ऐप्लिकेशन, ऐसा कॉन्टेंट जनरेट नहीं करेगा जो नुकसान पहुंचाने वाले सामान, सेवाओं, और गतिविधियों का प्रमोशन करता है या उनका ऐक्सेस देता है (उदाहरण के लिए, जुए, दवाओं, पटाखों, और यौन सेवाओं के प्रमोशन की सुविधा देना).
नुकसान पहुंचाने वाला कॉन्टेंट ऐप्लिकेशन में गैर-कानूनी या धोखाधड़ी वाली गतिविधियां करने के निर्देश नहीं दिए जाएंगे. जैसे- फ़िशिंग से जुड़ी धोखाधड़ी, स्पैम या बड़े पैमाने पर किए जाने वाले अनुरोध, जेलब्रेकिंग के तरीकों के बारे में निर्देश नहीं देगा.

डेवलपर संसाधन

जनरेटिव एआई की नीतियों के उदाहरण:

  • Cloud Gemini API और PaLM API में सुरक्षा से जुड़े एट्रिब्यूट की एक सूची दी जाती है. इन एट्रिब्यूट की मदद से, सुरक्षा नीतियां बनाई जा सकती हैं.
  • Google के एआई से जुड़े सिद्धांतों के प्रोग्रेस के अपडेट में शामिल नीतियों का उदाहरण
  • MLCommons असोसिएशन, एआई सिस्टम को बेहतर बनाने के लिए साथ मिलकर काम करने के सिद्धांत पर बना एक इंजीनियरिंग कंसोर्टियम है. इसमें उन छह खतरों के बारे में बताया गया है जिनके आधार पर वे एआई से सुरक्षा पर मॉडल का आकलन करते हैं. ये मॉडल, एआई सेफ़्टी मानदंड के तहत आते हैं.