Gemini की मदद से, आर्टिफ़िशियल इंटेलिजेंस (एआई) मॉडल का इस्तेमाल किया जा सकता है कई तरह का इनपुट डेटा शामिल है. जैसे, टेक्स्ट, इमेज, और ऑडियो. क्योंकि ये मॉडल एक से ज़्यादा टाइप या मोड डेटा का इस्तेमाल कर सकते हैं. Gemini मॉडल उन्हें मल्टीमॉडल मॉडल कहा जाता है या उन्हें मल्टीमॉडल क्षमताओं की तरह समझा जाता है.
इस पेज पर, ऐसी मीडिया फ़ाइलों को इस्तेमाल करने के दिशा-निर्देश और सबसे सही तरीके बताए गए हैं जो Gemini API के प्रॉम्प्ट होंगे. Gemini Files API का इस्तेमाल इन कामों के लिए कैसे किया जा सकता है, यह जानने के लिए मीडिया फ़ाइलें अपलोड करने और उन्हें अपने प्रॉम्प्ट में शामिल करने के लिए, विज़न, ऑडियो, और दस्तावेज़ प्रोसेसिंग से जुड़ी गाइड.
प्रॉम्प्ट के साथ मीडिया फ़ाइलें इस्तेमाल करना
अपने प्रॉम्प्ट में अलग-अलग तरह के डेटा का इस्तेमाल करने की अनुमति मिलने पर, आपको ज़्यादा इसमें यह तय किया जा सकता है कि Gemini API की मदद से कौनसे काम किए जा सकते हैं. इसके लिए उदाहरण के लिए, आप मॉडल को स्वादिष्ट भोजन की फ़ोटो भेज सकते हैं और उसे लिखने के लिए कह सकते हैं भोजन के बारे में एक छोटा ब्लॉग.
प्रॉम्प्ट | जवाब |
इस तस्वीर के आधार पर एक छोटी और दिलचस्प ब्लॉग पोस्ट लिखो. इसे ऐसा होना चाहिए फ़ोटो में खाने का ब्यौरा शामिल करो और अपने सफ़र के बारे में बताओ खाना पकाने की तैयारी करना. |
खाना पकाने की तैयारी करना समय और पैसे बचाने का एक शानदार तरीका है. यह ये सेहतमंद खाने में आपकी मदद करते हैं. यह भोजन पौष्टिक खाने का एक अच्छा उदाहरण है और स्वादिष्ट भोजन जिसे आसानी से पहले से तैयार किया जा सकता है. इस खाने में ब्राउन चावल, भुनी हुई सब्ज़ियां, और चिकन टेरियाकी शामिल हैं. ब्राउन राइस एक सेहत के लिए अच्छा और जटिल कार्बोहाइड्रेट होता है, जो आपको लगातार मिलने वाली ऊर्जा. भुनी हुई सब्ज़ियां रोज़ाना खाने का एक शानदार तरीका हैं की मात्रा में बहुत ज़्यादा विटामिन और मिनरल मिलते हैं. चिकन टेरियाकी स्वादिष्ट और इसमें ज़्यादा प्रोटीन होता है. इस तरह के खाने को भी आसानी से बनाया जा सकता है. भूरे चावल को पकाएं, भूनें चिकन टेरियाकी पकाएं. जब सब कुछ पक जाए, इसे खाना पकाने के लिए डिब्बाबंद करते हैं और रेफ़्रिजरेटर में स्टोर करते हैं. फिर आप एक कंटेनर ले जाकर सुबह-सुबह घूमने जा सकते हैं! अगर आपको पौष्टिक और स्वादिष्ट खाना चाहिए, तो समय से पहले पक जाने वाला यह खाना एक बेहतरीन विकल्प है. यह पैक किया हुआ है पोषक तत्व और स्वाद, और यह पक्का है कि आप भरा महसूस करें और तंदुरुस्ती महसूस करें. पेश है पौष्टिक और स्वादिष्ट खाने की रेसिपी! |
मीडिया का इस्तेमाल करके मैसेज भेजने की रणनीतियां
अगर आपको इस्तेमाल किए जाने वाले प्रॉम्प्ट से मनमुताबिक आउटपुट पाने में समस्या आ रही है मीडिया फ़ाइलें हैं, तो ऐसी कुछ रणनीतियां हैं जो आपको चाहते हैं. नीचे दिए गए सेक्शन में, डिज़ाइन करने के तरीके और समस्या हल करने के बारे में बताया गया है मल्टीमोडल इनपुट का इस्तेमाल करने वाले प्रॉम्प्ट को बेहतर बनाने के लिए सलाह.
मल्टीमोडल प्रॉम्प्ट को बेहतर बनाने के लिए, इन सबसे सही तरीकों को अपनाएं:
-
प्रॉम्प्ट डिज़ाइन से जुड़ी बुनियादी बातें
- निर्देशों में साफ़ तौर पर जानकारी दें: साफ़ तौर पर और कम शब्दों में निर्देश दें, ताकि उनका गलत मतलब निकाला जा सके.
- अपने प्रॉम्प्ट में कुछ उदाहरण जोड़ें: आपका लक्ष्य क्या है, यह बताने के लिए कुछ शॉट के साथ असली लगने वाले उदाहरणों का इस्तेमाल करें.
- इसे सिलसिलेवार तरीके से बांटें: मुश्किल टास्क को ऐसे सब-लक्ष्यों में बांट दें जिन्हें मैनेज किया जा सकता है. इससे, मॉडल को गाइड करने की पूरी प्रक्रिया में मदद मिलती है.
- आउटपुट का फ़ॉर्मैट तय करना: प्रॉम्प्ट में आउटपुट को अपनी पसंद के फ़ॉर्मैट में रखने का अनुरोध करें. जैसे, Markdown, JSON, HTML वगैरह.
- एक इमेज वाले प्रॉम्प्ट के लिए, अपनी इमेज को पहले रखें: Gemini, इमेज और टेक्स्ट इनपुट को किसी भी क्रम में हैंडल कर सकता है. हालांकि, एक इमेज वाले प्रॉम्प्ट के लिए, यह बेहतर परफ़ॉर्म कर सकता है. ऐसा तब होता है, जब उस इमेज को टेक्स्ट प्रॉम्प्ट से पहले रखा जाए.
-
मल्टीमॉडल प्रॉम्प्ट से जुड़ी समस्या हल करना
- अगर मॉडल, इमेज के सही हिस्से से जानकारी नहीं ले रहा है: यह संकेत छोड़ें कि आपको इमेज के किन हिस्सों से जानकारी हासिल करनी है.
- अगर मॉडल का आउटपुट बहुत जेनरिक है (इमेज के हिसाब से नहीं बनाया गया है): प्रॉम्प्ट की शुरुआत में, टास्क की शुरुआत में, मॉडल को इमेज के बारे में बताने के लिए कहें. इसके अलावा, टास्क के लिए निर्देश देने से पहले, मॉडल को इमेज में मौजूद जानकारी के बारे में बताने के लिए कहें.
प्रॉम्प्ट के डिज़ाइन से जुड़ी बुनियादी बातें
इस सेक्शन में, पिछले सेक्शन में बताए गए सबसे सही तरीकों के बारे में ज़्यादा जानकारी दी गई है.
ध्यान दें: Gemini के इन उदाहरणों से मिले मॉडल के नतीजे, हर रन के हिसाब से अलग-अलग हो सकते हैं.
अपने निर्देशों में खास जानकारी दें
प्रॉम्प्ट में सबसे ज़्यादा तब सफलता मिलती है, जब वे साफ़ तौर पर और विस्तार से लिखे गए हों. अगर आपने कोई खास आउटपुट दिया है, तो बेहतर होगा कि आप प्रॉम्प्ट में उस शर्त को शामिल करें. इससे यह पक्का किया जा सकेगा कि आपको मनमुताबिक आउटपुट मिल रहा है.
कई बार ऐसा हो सकता है कि सवाल का इंटेंट लिखने वाले व्यक्ति को साफ़ तौर पर लगे, लेकिन असल में उसके बारे में ज़्यादा जानकारी न दी गई हो. मॉडल के व्यवहार को पसंद के मुताबिक बनाने के लिए, यह देखें कि आपके प्रॉम्प्ट का गलत तरीके से क्या मतलब निकाला जा सकता है. साथ ही, पक्का करें कि आपके दिए गए निर्देश खास और साफ़ हों. जानकारी का गलत मतलब निकालने के लिए, बहुत कम जगह छोड़ें
एयरपोर्ट बोर्ड की इस इमेज के लिए, मॉडल से सिर्फ़ "इस इमेज के बारे में जानकारी देने" के लिए कहा जा रहा है सामान्य जानकारी जनरेट कर सकती है. अगर आपको इमेज से समय और शहर को पार्स करने के लिए मॉडल की ज़रूरत है, तो उस अनुरोध को सीधे अपने प्रॉम्प्ट में शामिल करें.
प्रॉम्प्ट | मॉडल से मिला रिस्पॉन्स |
---|---|
इस इमेज के बारे में बताएं. |
इस इमेज में, एयरपोर्ट पर पहुंचने और जाने वाली फ़्लाइट की जानकारी देने वाला बोर्ड दिखाया गया है. |
अपडेट किया गया प्रॉम्प्ट | बेहतर जवाब |
---|---|
इस इमेज में दिखाए गए एयरपोर्ट बोर्ड से समय और शहर को एक सूची में पार्स करें. |
कुछ उदाहरण जोड़ें
Gemini मॉडल एक से ज़्यादा इनपुट स्वीकार कर सकता है. इनका इस्तेमाल यह समझने के लिए किया जा सकता है कि आउटपुट को आपकी पसंद के मुताबिक़ बनाया जा सकता है. इन उदाहरणों को जोड़ने से, मॉडल को पैटर्न की पहचान करने और दी गई इमेज और दिए गए जवाबों के बीच संबंध. इसे यह भी कहा जाता है "कुछ शॉट" सीखना.
नीचे दिए गए उदाहरण में, शुरुआती आउटपुट को वाक्य के रूप में लिखा गया है और इसमें देश (ब्राज़ील). मान लें कि आपको आउटपुट को किसी अलग फ़ॉर्मैट या स्टाइल में रखना है और आपको सिर्फ़ शहर का है, देश नहीं. अपने प्रॉम्प्ट में कुछ शॉट के उदाहरण जोड़ने से, मॉडल बेहतर हो सकता है आपकी पसंद के मुताबिक जवाब देने के लिए.
प्रॉम्प्ट | मॉडल रिस्पॉन्स |
---|---|
लैंडमार्क के साथ-साथ शहर को भी पहचानें. |
ब्राज़ील के रियो डि जेनेरो में, क्राइस्ट द रिडीमर की मूर्ति काफ़ी मशहूर है. |
अपडेट किया गया प्रॉम्प्ट | बेहतर जवाब |
---|---|
लैंडमार्क के साथ-साथ शहर को भी पहचानें. |
शहर: रोम, लैंडमार्क: कोलसियम. |
शहर: बीजिंग, लैंडमार्क: फॉरबिडन सिटी |
|
शहर: रियो डे जेनेरो, लैंडमार्क: क्राइस्ट द रिडीमर की मूर्ति |
इसे सिलसिलेवार ढंग से बांटें
यह ऐप्लिकेशन ऐसे मुश्किल कामों में मददगार साबित हो सकता है जिनमें विज़ुअल समझने और रीज़निंग से जुड़े सवालों के जवाब शामिल हों टास्क को छोटे-छोटे और ज़्यादा आसान चरणों में बांटा जा सकता है. इसके अलावा, यह तरीका भी कारगर साबित हो सकता है, अगर अपने प्रॉम्प्ट में मॉडल को “सिलसिलेवार तरीके से सोचने” के लिए कहें.
प्रॉम्प्ट | मॉडल से मिला रिस्पॉन्स |
---|---|
मेरा टॉयलेट पेपर कब खत्म हो जाएगा? |
जल्द ही, आपके लिए सिर्फ़ तीन रोल बचे हैं. |
अपडेट किया गया प्रॉम्प्ट | बेहतर जवाब |
---|---|
|
|
गणित के सवाल या अन्य तरह के शब्द से जुड़े सवाल, मॉडल को सिलसिलेवार तरीके से सोचने के लिए कहने का अच्छा तरीका है.
प्रॉम्प्ट | जवाब |
---|---|
क्रम का चौथा पद क्या है? |
-135 |
मॉडल से मिला जवाब गलत है. इसे बेहतर बनाने के कुछ तरीके यह है कि प्रॉम्प्ट का जवाब देने से पहले, मॉडल को समस्या को पार्स करने के लिए कहें.
प्रॉम्प्ट | जवाब |
---|---|
पहले इमेज में मौजूद फ़ॉर्मूला को पार्स करें. फिर, फ़ॉर्मूला के आधार पर, जवाब दें कि "क्रम में चौथा शब्द क्या है?". |
नतीजे को बड़ा करने के लिए क्लिक करें$$ b(n) = b(n-1) * (-3) $$ $$ b(1) = 15 $$
$$ b(4) = b(4-1) * (-3) $$ $$ b(4) = b(3) * (-3) $$ $$ b(3) = b(3-1) * (-3) $$ $$ b(3) = b(2) * (-3) $$ $$ b(2) = b(2-1) * (-3) $$ $$ b(2) = b(1) * (-3) $$ $$ b(2) = 15 * (-3) $$ $$ b(2) = -45 $$ $$ b(3) = b(2) * (-3) $$ $$ b(3) = -45 * (-3) $$ $$ b(3) = 135 $$ $$ b(4) = b(3) * (-3) $$ $$ b(4) = 135 * (-3) $$ $$ b(4) = -405 $$ इसलिए, इस क्रम का चौथा पद -405 है. |
यह मॉडल रिस्पॉन्स सही है - अब जवाब को और भी बेहतर बनाने के लिए, मॉडल को सिलसिलेवार तरीके से सोचने के लिए कहा जा सकता है.
अपडेट किया गया प्रॉम्प्ट | बेहतर जवाब |
---|---|
क्रम का चौथा पद क्या है? सिलसिलेवार तरीके से सोचें. |
पहला शब्द 15 है. दूसरा शब्द b(1) * (-3) = 15 * (-3) = -45 है. तीसरा टर्म है b(2) * (-3) = -45 * (-3) = 135. चौथा शब्द b(3) * (-3) = 135 * (-3) = -405 है. |
आउटपुट फ़ॉर्मैट तय करने की कोशिश करें
एक आम समस्या यह होती है कि मॉडल आउटपुट को किसी खास फ़ॉर्मैट (जैसे, Markdown, JSON, HTML) में होना चाहिए. खास तौर पर तब, जब मॉडल आउटपुट के लिए डाउनस्ट्रीम टास्क से डेटा डाला जा सकता है. प्रॉम्प्ट में मॉडल को निर्देश देकर, उस फ़ॉर्मैट में आउटपुट देने की कोशिश करें. नीचे दो उदाहरण दिए गए हैं:
प्रॉम्प्ट | मॉडल से मिला रिस्पॉन्स |
---|---|
इस इमेज में मौजूद टेबल को मार्कडाउन फ़ॉर्मैट में पार्स करें |
| विषय | स्थिति | समय | शुरू होने की तारीख | आखिरी तारीख | | ------- | ------ | ---- | - जानी चाहिए | ------ | | गणित | हो गया | 1.5 घंटे | 29/11/2023 | 1/12/2023 | | देश या इलाका | हो गया | 30 मिनट | 2/12/2023 | 4/12/2023 | | भौतिकी | चल रहा है | 2 घंटे | 3/12/2023 | 5/12/2023 | | जीव विज्ञान | शुरू नहीं हुई | 6 घंटे | 2/11/2016 | 6/12/2023 | |
प्रॉम्प्ट | मॉडल रिस्पॉन्स |
---|---|
नीचे दिए गए सभी एट्रिब्यूट की सूची दें: सामग्री, व्यंजन का प्रकार, शाकाहारी या नहीं, JSON प्रारूप में |
|
एक इमेज वाले प्रॉम्प्ट के लिए, अपनी इमेज को प्राथमिकता देना
Gemini, प्रॉम्प्ट के ज़रिए इमेज और टेक्स्ट को किसी भी क्रम में समझ सकता है. साथ ही, एक ही इमेज का इस्तेमाल करके इससे पहले कि टेक्स्ट प्रॉम्प्ट बेहतर नतीजे दे सके. नीचे दिए गए सैंपल में, आपको हर प्रॉम्प्ट में टेक्स्ट से पहले आता है.
मल्टीमोडल प्रॉम्प्ट से जुड़ी समस्या हल करना
अगर आपको बेहतर जवाब नहीं मिल रहा है, तो हो सकता है कि आपको प्रॉम्प्ट की समस्या को हल करना पड़े. यहां कुछ रणनीतियां दी गई हैं, जिन्हें आप आज़मा सकते हैं.
अगर मॉडल, इमेज के सही हिस्से से जानकारी नहीं ले रहा है
ज़्यादा सटीक जवाब पाने के लिए, यह बताएं कि आपको इमेज के किन हिस्सों को प्रॉम्प्ट भेजना है इससे जानकारी निकाल सकते हैं.
प्रॉम्प्ट | मॉडल से मिला रिस्पॉन्स |
---|---|
ये डायपर कितने दिनों तक बच्चे को चलेंगे? |
डायपर खत्म होने से पहले, यह 198 दिनों तक चलेगा. |
अपडेट किया गया प्रॉम्प्ट | बेहतर जवाब |
---|---|
ये डायपर खत्म होने से पहले, ये कितने समय तक चलेंगे? बच्चे की उम्र तय करने के लिए, बॉक्स पर दिखाए गए वज़न का इस्तेमाल करें और बॉक्स में डायपर की कुल संख्या इस्तेमाल करें. कुल संख्या को इस संख्या से भाग देने पर कि बच्चा हर दिन कितने डायपर पास करता है. |
बॉक्स में 198 डायपर हैं. बॉक्स में लिखा है कि डायपर 22-37 lbs वज़न वाले बच्चे के लिए हैं. इस वज़न सीमा में आम तौर पर बच्चा 1 से 2 साल की उम्र का हो सकता है. दो साल का डायपर, आम तौर पर हर दिन छह डायपर से गुज़रता है. इसलिए, यह डायपर 33 दिनों (198/6) तक चलेगा. |
अगर मॉडल का आउटपुट बहुत जेनरिक है और इमेज इनपुट के हिसाब से उसके मुताबिक नहीं है
इमेज के हिसाब से जवाब तैयार करने में मॉडल की मदद करने के लिए, रीज़निंग से जुड़े टास्क करने से पहले, उससे इमेज के बारे में जानकारी देने के लिए कहें.
प्रॉम्प्ट | मॉडल से मिला रिस्पॉन्स |
---|---|
इन इमेज में क्या समानता है? |
ये चारों इमेज लैंडस्केप फ़ोटोग्राफ़ी के उदाहरण हैं. |
अपडेट किया गया प्रॉम्प्ट | बेहतर जवाब |
---|---|
सबसे पहले, पूरी जानकारी दें कि हर इमेज में क्या है. इन इमेज में क्या समानता है? |
पहली इमेज में एक व्यक्ति सूटकेस पैक करते हुए दिख रहा है. दूसरी इमेज में शॉपिंग मॉल का एक खाली गलियारा दिखाया गया है. तीसरी इमेज में टॉयलेट पेपर का रोल दिखाया गया है. चौथी इमेज में, गहरे और तूफ़ानी समुद्र को दिखाया गया है. इन इमेज के बीच एक समानता यह है कि ये सभी लिमिनल स्पेस के उदाहरण हैं. दो अन्य जगहों या स्थितियों के बीच में आने वाली जगहों को लिमिनल स्पेस कहा जाता है. अक्सर इन्हें अनिश्चितता या अस्पष्टता की वजह से मानी जाती है. पहली इमेज में व्यक्ति को दिखाया गया है कि वह घर पर है और यात्रा पर है. दूसरी इमेज में दो स्टोर के बीच का गलियारा दिखाया गया है. तीसरी इमेज टॉयलेट पेपर की है, जिसमें बाथरूम को दिखाया जा सकता है. बाथरूम, दो निजी कामों के लिए एक अलग जगह होती है सार्वजनिक जीवन में काम आ रहा है. यह वह जगह है जहां हम खुद को बाहर की दुनिया में जाने या उससे बाहर जाने के लिए तैयार करते हैं. चौथी इमेज में समुद्र को शांत और तूफ़ानी होने के बीच दिखाया गया है. छोटे-छोटे स्पेस, रोमांचक और विचलित करने वाले, दोनों हो सकते हैं. यह एक नई शुरुआत या अंत का स्थान हो सकता है. ये चिंतन या क्रिया का स्थान हो सकते हैं. |
आपके पास, मॉडल को इमेज में मौजूद कॉन्टेंट का ज़िक्र करने के लिए कहने की भी कोशिश करने का विकल्प है.
अपडेट किया गया प्रॉम्प्ट | बेहतर जवाब |
---|---|
इन इमेज में क्या समानता है? देखें कि आपके जवाब में मौजूद इमेज में क्या है. |
ये सभी तस्वीरें यात्रा से जुड़ी हैं. पहली इमेज में एक व्यक्ति को सूटकेस पैक करते हुए दिखाया गया है. दूसरी इमेज में दिखाया गया है शॉपिंग मॉल के एक खाली गलियारे की इमेज. तीसरी इमेज में टॉयलेट पेपर का ढेर दिखाया गया है. चौथी इमेज में गहरा और तूफ़ानी समुद्र. ये सभी इमेज यात्रा से संबंधित हैं, क्योंकि ये वे सभी चीज़ें हैं जिनकी लोगों को ज़रूरत है या जब वे इनका इस्तेमाल करते हैं वे कैसे सफ़र करते हैं. पहली इमेज में एक व्यक्ति को सूटकेस पैक करते हुए दिखाया गया है. यह ऐसा काम है जिसे लोग तब करते हैं, जब वे यात्रा पर जा रहे हैं. दूसरी इमेज में शॉपिंग मॉल का एक खाली गलियारा दिखाया गया है. यह वह जगह है जहां लोग अक्सर अपनी यात्राओं के लिए चीज़ें खरीदने जाते हैं. तीसरी इमेज में टॉयलेट पेपर का ढेर दिखाया गया है. इसमें जिनका इस्तेमाल लोग अक्सर यात्रा करते समय करते हैं. चौथी इमेज में गहरे और तूफ़ानी समुद्र को दिखाया गया है, जो कुछ ऐसा जो यात्रा के दौरान लोग अक्सर देखते हैं. |
ये सुझाव, इमेज से क्रिएटिव कॉन्टेंट बनाने के लिए भी काम करते हैं. नीचे दिए गए उदाहरण में, खरगोश, साफ़ तौर पर मॉडल से इमेज के पहलुओं को शामिल करने के लिए कह सकता है. इससे आउटपुट बेहतर हो सकता है.
प्रॉम्प्ट | मॉडल से मिला रिस्पॉन्स |
---|---|
क्या तुम इस इमेज के बारे में एक कविता लिख सकते हो? |
छोटा खरगोश, जो मुलायम और भूरे रंग का हो, आप घास पर चबाते हैं, बहुत हरी और मीठी, |
अपडेट किया गया प्रॉम्प्ट | बेहतर जवाब |
---|---|
क्या तुम इस इमेज के बारे में एक ऐसी कविता लिख सकते हो जो कि पूरी जानकारी देती हो और जिसमें जगह की जानकारी भी शामिल हो? |
हरे रंग में छोटा खरगोश, क्या यह समुद्र का नीला है, छोटा खरगोश, सच कहो, शायद इन सबके बीच का रिश्ता है, छोटा खरगोश, सोच रहा हूं तुम क्या सपने देखती हो, चाहे कुछ भी हो, छोटा खरगोश, |
समस्या हल करना कि प्रॉम्प्ट का कौनसा हिस्सा पूरा नहीं हो सका
यह जानना मुश्किल हो सकता है कि मॉडल, प्रॉम्प्ट फ़ेल हुआ या नहीं शुरू करने से इमेज को समझ नहीं आया या इमेज को समझ नहीं पाया, लेकिन इसके बाद, रीज़निंग से जुड़े चरणों को सही तरीके से लागू नहीं किया गया.
इन वजहों के बीच अंतर करने के लिए, मॉडल से यह बताने के लिए कहें कि इमेज में क्या है.
नीचे दिए गए उदाहरण में, अगर मॉडल एक ऐसे स्नैक्स के साथ जवाब देता है, जिसके साथ जोड़े जाने पर वह मज़ेदार लगता है चाय (जैसे कि पॉपकॉर्न) पर शेयर किया जाता है, तो सबसे पहले समस्या हल करके यह पता लगाया जा सकता है कि मॉडल सही तरीके से पहचाना गया है या नहीं इमेज में चाय मौजूद है.
प्रॉम्प्ट | समस्या हल करने के लिए निर्देश |
---|---|
मैं एक मिनट में ऐसा कौनसा नाश्ता बना सकती हूँ जो सही रहेगा? |
बताएं कि इस इमेज में क्या है. |
दूसरी रणनीति यह है कि मॉडल से उसकी वजह बताने के लिए कहा जाए. इससे आपको यह पता लगाने में मदद मिल सकती है कि अगर कोई वजह बताई गई है, तो कौनसी गड़बड़ी हुई है.
प्रॉम्प्ट | समस्या हल करने के लिए निर्देश |
---|---|
मैं एक मिनट में ऐसा कौनसा नाश्ता बना सकती हूँ जो सही रहेगा? |
मैं एक मिनट में ऐसा कौनसा नाश्ता बना सकती हूँ जो सही रहेगा? कृपया इसकी वजह बताएं. |
प्रतिचयन पैरामीटर ट्यून करना
हर अनुरोध में, मॉडल को सिर्फ़ मल्टीमोडल प्रॉम्प्ट ही नहीं, बल्कि सैंपलिंग पैरामीटर का भी सेट भेजा जाता है. मॉडल, अलग-अलग पैरामीटर वैल्यू के लिए अलग-अलग नतीजे जनरेट कर सकता है. अलग-अलग तरह के पैरामीटर का इस्तेमाल करें, ताकि आपको टास्क के लिए सबसे सही वैल्यू मिल सके. आम तौर पर, अडजस्ट किए जाने वाले पैरामीटर ये हैं:
- तापमान
- टॉप-पी
- टॉप-के
तापमान
तापमान का इस्तेमाल, रिस्पॉन्स जनरेट करने के दौरान सैंपलिंग के लिए किया जाता है. यह तब होता है, जब टॉप-P और टॉप-K को लागू किया जाता है.
तापमान की मदद से, टोकन चुनने में किसी भी तरह की गड़बड़ी को कंट्रोल किया जाता है. तापमान कम करना ऐसे प्रॉम्प्ट के लिए अच्छा है
ज़्यादा डिटरमिनिस्टिक और कम ओपन-एंडेड या क्रिएटिव रिस्पॉन्स की ज़रूरत होती है. वहीं, ज़्यादा तापमान का इस्तेमाल करने पर
विविधता या क्रिएटिव तरीके से. 0 तापमान डिटर्मिनिस्टिक होता है. इसका मतलब है कि प्रॉबबिलिटी की सबसे ज़्यादा प्रतिक्रिया
हमेशा चुना जाता है.
ज़्यादातर मामलों में, तापमान 0.4 से शुरू करके देखें. अगर आपको ज़्यादा क्रिएटिव नतीजे चाहिए, तो तापमान. अगर आपको ठीक से नहीं दिख रहा है, तो तापमान को कम करके देखें.
टॉप-के
Top-K, मॉडल के आउटपुट के लिए टोकन चुनने के तरीके को बदलता है. 1 में से टॉप-K का मतलब है कि अगला चुना गया टोकन यह है
इस मॉडल के शब्दावली में मौजूद सभी टोकन में से सबसे ज़्यादा संभावना है (इसे ग्रीडी डिकोडिंग भी कहा जाता है), जबकि
3 में से टॉप-K का मतलब है कि अगला टोकन,
तापमान का इस्तेमाल किया जा रहा है.
टोकन चुनने के हर चरण के लिए, सबसे ज़्यादा संभावना वाले टॉप-K टोकन का सैंपल लिया जाता है. इसके बाद टोकन को टॉप-पी के हिसाब से और फ़िल्टर किया जाता है. इसमें टॉप-P के हिसाब से आखिरी टोकन चुना जाता है. इसके लिए, टेंपरेचर सैंपलिंग का इस्तेमाल किया जाता है.
कम बेतरतीब जवाबों के लिए कम मान और ज़्यादा रैंडम जवाबों के लिए ज़्यादा मान तय करें. टॉप-K की डिफ़ॉल्ट वैल्यू 32 है.
टॉप-पी
टॉप-P, आउटपुट के लिए टोकन चुनने के तरीके को बदलता है. सबसे ज़्यादा टोकन में से चुना गया है (टॉप-K देखें)
तब तक कम से कम संभावित रखे जाते हैं, जब तक उनकी प्रायिकताओं का योग टॉप-P मान के बराबर न हो. उदाहरण के लिए, अगर टोकन
A, B, और C की संभावना 0.6, 0.3, 0.1 है और टॉप-P वैल्यू 0.9 है, तो मॉडल
तापमान का इस्तेमाल करके, A या B को अगले टोकन के तौर पर चुनें. साथ ही, C को छोड़ दें.
कम बेतरतीब जवाबों के लिए कम मान और ज़्यादा रैंडम जवाबों के लिए ज़्यादा मान तय करें. टॉप-P की डिफ़ॉल्ट वैल्यू 1.0 है.
अगले चरण
- Google के एआई का इस्तेमाल करके, अपने मल्टीमॉडल प्रॉम्प्ट खुद लिखें Studio.
- प्रॉम्प्ट के डिज़ाइन के बारे में ज़्यादा जानने के लिए, सलाह की रणनीतियां पेज.