ज़िम्मेदारी के साथ जनरेटिव एआई का इस्तेमाल करने के लिए टूलकिट
ओपन एआई मॉडल को ज़िम्मेदारी के साथ डिज़ाइन, बनाने, और उनका आकलन करने के लिए टूल और दिशा-निर्देश.
ऐप्लिकेशन का ज़िम्मेदारी के साथ डिज़ाइन करना
मॉडल के व्यवहार के लिए नियम तय करें, सुरक्षित और जवाबदेह ऐप्लिकेशन बनाएं, और उपयोगकर्ताओं के साथ पारदर्शी तरीके से बातचीत करें.
सुरक्षा अलाइनमेंट
एआई मॉडल को सुरक्षा नीतियों के मुताबिक बनाने के लिए, फ़ाइन-ट्यूनिंग और आरएलएचएफ़ के साथ-साथ, तुरंत गड़बड़ी ठीक करने की तकनीकों और दिशा-निर्देशों के बारे में जानें.
मॉडल का आकलन
LLM कम्पेरेटर की मदद से, मॉडल की सुरक्षा, निष्पक्षता, और सटीक होने की जांच करने के लिए दिशा-निर्देश और डेटा पाएं.
सुरक्षा के उपाय
पहले से मौजूद सलूशन का इस्तेमाल करके, सुरक्षा क्लासिफ़ायर को डिप्लॉय करें या सिलसिलेवार निर्देशों वाले ट्यूटोरियल की मदद से, खुद का क्लासिफ़ायर बनाएं.
ज़िम्मेदारी के साथ काम करने का तरीका तय करना
अपने ऐप्लिकेशन के संभावित जोखिमों की पहले से पहचान करें. साथ ही, उपयोगकर्ताओं के लिए सुरक्षित और भरोसेमंद ऐप्लिकेशन बनाने के लिए, सिस्टम-लेवल का तरीका तय करें.
अपनी प्रोफ़ाइल बनाना शुरू करें
सिस्टम-लेवल की नीतियां तय करना
तय करें कि आपके ऐप्लिकेशन को किस तरह का कॉन्टेंट जनरेट करना चाहिए और किस तरह का नहीं.
सुरक्षा के लिए डिज़ाइन करना
जोखिम कम करने की तकनीकों को लागू करने के लिए, अपना पूरा तरीका तय करें. इसमें तकनीकी और कारोबार से जुड़े फ़ायदे और नुकसान को ध्यान में रखें.
सही जानकारी दें
मॉडल कार्ड जैसी आर्टफ़ैक्ट की मदद से, अपने तरीके के बारे में बताएं.
एआई सिस्टम को सुरक्षित करना
एआई सिस्टम को सुरक्षित रखने के फ़्रेमवर्क (एसएआईएफ़) में बताए गए, एआई से जुड़े सुरक्षा जोखिमों और उन्हें ठीक करने के तरीकों पर विचार करें.
अपना मॉडल अलाइन करना
प्रॉम्प्ट और ट्यूनिंग तकनीकों का इस्तेमाल करके, अपने मॉडल को सुरक्षा से जुड़ी खास नीतियों के मुताबिक अलाइन करें.
अपनी प्रोफ़ाइल बनाना शुरू करें
ज़्यादा सुरक्षित और मज़बूत प्रॉम्प्ट बनाएं
मॉडल अलाइनमेंट लाइब्रेरी की मदद से, सुरक्षित प्रॉम्प्ट टेंप्लेट बनाने के लिए एलएलएम की सुविधा का इस्तेमाल करें.
सुरक्षा के लिए मॉडल को ट्यून करना
सुरक्षा और कॉन्टेंट से जुड़ी नीतियों के मुताबिक मॉडल को ट्यून करके, मॉडल के व्यवहार को कंट्रोल करें.
मॉडल प्रॉम्प्ट की जांच करना
लर्निंग इंटरप्रिटेबिलिटी टूल (एलआईटी) की मदद से, बार-बार सुधार करके सुरक्षित और मददगार प्रॉम्प्ट बनाएं.
अपने मॉडल का आकलन करना
हमारे दिशा-निर्देशों और टूल का इस्तेमाल करके, मॉडल के जोखिमों का आकलन करें. इनमें सुरक्षा, निष्पक्षता, और तथ्यों के सटीक होने से जुड़े जोखिम शामिल हैं.
अपनी प्रोफ़ाइल बनाना शुरू करें
एलएलएम कम्पैरेटर
एलएलएम कम्पेरेटर की मदद से, एक साथ कई मॉडल की तुलना करें. इससे, मॉडल के जवाबों में अंतर, एक ही मॉडल के लिए अलग-अलग प्रॉम्प्ट या मॉडल की अलग-अलग ट्यूनिंग के बीच के अंतर का आकलन किया जा सकता है
मॉडल के आकलन से जुड़े दिशा-निर्देश
रेड टीमिंग के सबसे सही तरीकों के बारे में जानें. साथ ही, अपने मॉडल का आकलन, शिक्षा से जुड़े मानदंडों के हिसाब से करें, ताकि सुरक्षा, निष्पक्षता, और तथ्यों के आधार पर नुकसान का आकलन किया जा सके.
सुरक्षा उपायों की मदद से सुरक्षित रखना
अपने ऐप्लिकेशन के इनपुट और आउटपुट को फ़िल्टर करें और उपयोगकर्ताओं को अनचाहे नतीजों से बचाएं.
अपनी प्रोफ़ाइल बनाना शुरू करें
SynthID टेक्स्ट
यह टूल, आपके मॉडल से जनरेट किए गए टेक्स्ट को वॉटरमार्क करने और उसकी पहचान करने में मदद करता है.
ShieldGemma
Gemma 2 पर आधारित, कॉन्टेंट की सुरक्षा से जुड़े क्लासिफ़ायर की सीरीज़. यह तीन साइज़ में उपलब्ध है: 2B, 9B, 27B.
एजाइल क्लासिफ़ायर
कम ट्रेनिंग डेटा के साथ पैरामीटर-एफ़िशिएंट ट्यूनिंग (पीईटी) का इस्तेमाल करके, अपनी खास नीतियों के लिए सेफ़्टी क्लासिफ़ायर बनाएं
एआई सेफ़्टी की जांच करता है
एपीआई और मॉनिटरिंग डैशबोर्ड की मदद से, एआई की सुरक्षा से जुड़ी अपनी कॉन्टेंट नीतियों का पालन करने की पुष्टि करें.
टेक्स्ट मॉडरेशन सेवा
सुरक्षा से जुड़े एट्रिब्यूट की सूची का पता लगाएं. इसमें, नुकसान पहुंचाने वाली कई कैटगरी और ऐसे विषय शामिल हैं जिन्हें संवेदनशील माना जा सकता है. यह Google Cloud Natural Language API, इस्तेमाल की तय सीमा के तहत बिना किसी शुल्क के उपलब्ध है.
Perspective API
Google Jigsaw के इस बिना किसी शुल्क वाले एपीआई की मदद से, "नफ़रत फैलाने" वाली टिप्पणियों की पहचान करें. इससे ऑनलाइन प्लैटफ़ॉर्म पर बुरे बर्ताव को कम करने और बातचीत के माहौल को बेहतर बनाने में मदद मिलती है.