फ़ाइल से जुड़ी सूचना देने की रणनीतियां

Gemini आर्टिफ़िशियल इंटेलिजेंस (AI) मॉडल की मदद से बनाया गया है. इसे टेक्स्ट, इमेज, और ऑडियो जैसे कई तरह के इनपुट डेटा को हैंडल करने के लिए बनाया गया है. इन मॉडल में एक से ज़्यादा टाइप या मोड के डेटा का इस्तेमाल किया जा सकता है. इसलिए, Gemini मॉडल को मल्टीमोडल मॉडल कहा जाता है. इसके अलावा, ये मल्टीमॉडल मॉडल भी कहा जाता है.

इस पेज पर Gemini API के लिए निर्देशों के साथ मीडिया फ़ाइलों को इस्तेमाल करने के दिशा-निर्देश और सबसे सही तरीके बताए गए हैं. मीडिया फ़ाइलों को अपलोड करने और उन्हें अपने प्रॉम्प्ट में शामिल करने के लिए, Gemini Files API का इस्तेमाल करने के बारे में जानने के लिए, मीडिया फ़ाइलों से अनुरोध करना देखें.

प्रॉम्प्ट के साथ मीडिया फ़ाइलों का इस्तेमाल करना

अपने प्रॉम्प्ट में अलग-अलग तरह के डेटा का इस्तेमाल करने से, Gemini API की मदद से किए जा सकने वाले काम बेहतर तरीके से किए जा सकते हैं. उदाहरण के लिए, आप मॉडल को स्वादिष्ट खाने की फ़ोटो भेज सकते हैं और उसे खाने के बारे में एक छोटा ब्लॉग लिखने के लिए कह सकते हैं.

प्रॉम्प्ट जवाब

इस फ़ोटो के आधार पर, एक छोटी और दिलचस्प ब्लॉग पोस्ट लिखो. इसमें फ़ोटो में खाने का ब्यौरा शामिल होना चाहिए. साथ ही, इसमें मेरे खाने की तैयारी के बारे में जानकारी होनी चाहिए.


कुकी

खाने के लिए तैयारी करने से समय और पैसे बचाने में मदद मिलती है. साथ ही, यह सेहतमंद खाने में भी आपकी मदद कर सकता है. यह खाना, स्वादिष्ट और सेहतमंद भोजन का बेहतरीन उदाहरण है, जिसे समय से पहले आसानी से तैयार किया जा सकता है.

इस खाने में ब्राउन चावल, भुनी हुई सब्ज़ियां, और चिकन टेरियाकी शामिल है. ब्राउन चावल एक पौष्टिक और जटिल कार्बोहाइड्रेट है जिससे आपको लंबे समय तक ऊर्जा मिलती है. भुनी हुई सब्ज़ियां, आपको हर दिन विटामिन और मिनरल की खुराक बढ़ाने का बेहतरीन तरीका हैं. साथ ही, चिकन टरियाकी एक स्वादिष्ट और प्रोटीन से भरपूर विकल्प है.

यह खाना बनाने में भी बहुत आसान है. बस ब्राउन चावल पकाएं, सब्ज़ियां भूनें, और चिकन टेरियाकी पकाएं. सब कुछ पक जाने के बाद, इसे डिश बनाने के लिए इस्तेमाल होने वाले कंटेनर में अलग-अलग रखें और फिर उन्हें रेफ़्रिजरेटर में रखें. फिर आप कंटेनर लेकर सुबह जा सकते हैं!

अगर आपको कोई ऐसा पौष्टिक और स्वादिष्ट खाना चाहिए जिसे समय से पहले आसानी से तैयार किया जा सके, तो यह खाना आपके लिए बेहतरीन विकल्प है. इसमें कई पोषक तत्व और फ़्लेवर होते हैं. साथ ही, इससे आपको तंदुरुस्त और भरा महसूस होगा.

यहां से पौष्टिक और स्वादिष्ट डिश बनाई जा सकती है!

मीडिया से सूचना देने की रणनीतियां

अगर आपको मीडिया फ़ाइलों का इस्तेमाल करने वाले प्रॉम्प्ट से मनमुताबिक नतीजा पाने में समस्या आ रही है, तो कुछ ऐसी रणनीतियां हैं जिनसे आपको मनमुताबिक नतीजे मिल सकते हैं. नीचे दिए गए सेक्शन में, मल्टीमोडल इनपुट का इस्तेमाल करने वाले प्रॉम्प्ट को बेहतर बनाने के लिए डिज़ाइन से जुड़े तरीके और समस्या हल करने की सलाह दी गई है.

इन सबसे सही तरीकों को अपनाकर, मल्टीमोडल प्रॉम्प्ट बेहतर बनाए जा सकते हैं:

प्रॉम्प्ट डिज़ाइन की बुनियादी बातें

  • ध्यान दें: कम शब्दों में सटीक और साफ़ तौर पर निर्देश दें, ताकि उनका मतलब आसानी से न निकाला जा सके.
  • अपने प्रॉम्प्ट में कुछ उदाहरण जोड़ें: आपको क्या हासिल करना है, यह बताने के लिए कुछ ऐसे सटीक उदाहरण इस्तेमाल करें जो असल ज़िंदगी में इस्तेमाल किए जा सकें.
  • सिलसिलेवार तरीके से इसे बांटें: मुश्किल टास्क को आसानी से मैनेज किए जा सकने वाले उप-लक्ष्यों में बांटें. साथ ही, मॉडल को सिलसिलेवार तरीके से निर्देश दें.
  • आउटपुट फ़ॉर्मैट बताएं: अपने सवाल में, आउटपुट को अपनी पसंद के फ़ॉर्मैट में रखने के लिए कहें, जैसे कि Markdown, JSON, HTML वगैरह.
  • एक इमेज वाले प्रॉम्प्ट के लिए, अपनी इमेज को सबसे पहले रखें: Gemini इमेज और टेक्स्ट इनपुट को किसी भी क्रम में हैंडल कर सकता है. हालांकि, एक इमेज वाले प्रॉम्प्ट के लिए, टेक्स्ट प्रॉम्प्ट से पहले इमेज जोड़ने पर, बेहतर परफ़ॉर्म कर सकता है.

    मल्टीमोडल प्रॉम्प्ट से जुड़ी समस्या हल करना

    • अगर मॉडल, इमेज के काम के हिस्से से जानकारी नहीं बना रहा है, तो: संकेत दें कि आपको इमेज के किस आसपेक्ट से जानकारी लेनी है.
    • अगर मॉडल का आउटपुट बहुत जेनरिक है (इमेज के हिसाब से नहीं बनाया गया है): मैसेज की शुरुआत में, टास्क के बारे में निर्देश देने से पहले, मॉडल से इमेज के बारे में बताने के लिए कहें. इसके अलावा, मॉडल से इमेज में मौजूद जानकारी के बारे में बताने के लिए कहें.
    • प्रॉम्प्ट डिज़ाइन से जुड़ी बुनियादी बातें

      इस सेक्शन में, पिछले सेक्शन में बताए गए सबसे सही तरीकों के बारे में बताया गया है.

      ध्यान दें: Gemini के इन उदाहरणों से मिले मॉडल के नतीजे, दौड़ने के हिसाब से अलग-अलग हो सकते हैं.

      अपने निर्देशों में सटीक जानकारी दें

      प्रॉम्प्ट तब ज़्यादा काम आते हैं, जब उनमें साफ़ तौर पर और पूरी जानकारी दी गई हो. अगर आपने कोई खास आउटपुट तय किया है, तो प्रॉम्प्ट में उस शर्त को शामिल करना बेहतर है, ताकि यह पक्का किया जा सके कि आपको मनमुताबिक नतीजा मिल रहा है.

      कभी-कभी प्रॉम्प्ट का इंटेंट, उसे लिखने वाले व्यक्ति को साफ़ तौर पर दिख सकता है, लेकिन असल में उसके बारे में पूरी जानकारी नहीं दी जाती. मॉडल के काम करने के तरीके को पसंद के मुताबिक बनाने के लिए, देखें कि आपके प्रॉम्प्ट का गलत मतलब निकाला जा सकता है या नहीं. साथ ही, पक्का करें कि आपने जो निर्देश दिए हैं वे सटीक और साफ़ हों. इस बात का ध्यान रखें कि लोग ज़रूरत के हिसाब से कोई मतलब न निकाल पाएं

      एयरपोर्ट बोर्ड की इस इमेज के लिए, मॉडल से सिर्फ़ "इस इमेज के बारे में बताएं" कहने से सामान्य जानकारी जनरेट हो सकती है. अगर आपको इमेज में दिए गए समय और शहर को पार्स करने के लिए मॉडल की ज़रूरत है, तो उस अनुरोध को सीधे अपने प्रॉम्प्ट में शामिल किया जा सकता है.

      प्रॉम्प्ट मॉडल रिस्पॉन्स

      इस इमेज के बारे में जानकारी दें.

      इस इमेज में, एयरपोर्ट पर आने और जाने की जानकारी वाला बोर्ड दिखाया गया है.

      अपडेट किया गया प्रॉम्प्ट बेहतर जवाब
      यात्रा का समय-सारणी

      इस इमेज में दिखाए गए एयरपोर्ट बोर्ड से समय और शहर को एक सूची में पार्स करें.

    • 10:50 मॉस्को
    • 11:05 एडिनबर्ग
    • 11:05 लंदन
    • 11:10 बुखारेस्ट
    • 11:30 कीव
    • 11:35 डबलिन
    • 11:45 ईस्ट मिडलैंड्स
    • 12:15 सोफ़िया
    • 12:30 लंदन
    • 12:30 न्यूकैसल
    • 12:40 सेंट पीटर्सबर्ग
    • 12:40 लंदन
    • 12:45 मैनचेस्टर
    • कुछ उदाहरण जोड़ें

      Gemini मॉडल कई इनपुट को स्वीकार कर सकता है. इन इनपुट का इस्तेमाल, यह आपके काम के आउटपुट को समझने के लिए उदाहरण के तौर पर कर सकता है. इन उदाहरणों को जोड़ने से, मॉडल को पैटर्न की पहचान करने में मदद मिल सकती है. साथ ही, इससे दी गई इमेज और नए उदाहरण के जवाबों के बीच संबंध लागू हो सकता है. इसे "फ़्यू-शॉट" लर्निंग भी कहा जाता है.

      नीचे दिए गए उदाहरण में, शुरुआती आउटपुट वाक्य के रूप में लिखा गया है और इसमें देश (ब्राज़ील) भी शामिल है. मान लीजिए कि आपको आउटपुट एक अलग फ़ॉर्मैट या स्टाइल में चाहिए और आपको सिर्फ़ शहर चाहिए, न कि देश. अपने प्रॉम्प्ट में कुछ शॉट के उदाहरण जोड़ने से, मॉडल को आपकी पसंद के हिसाब से जवाब देने में मदद मिल सकती है.

      प्रॉम्प्ट मॉडल रिस्पॉन्स
      यात्रा का समय-सारणी

      लैंडमार्क के साथ शहर का पता लगाएं.

      ब्राज़ील के रियो डे जेनेरो में मौजूद क्राइस्ट द रिडीमर मूर्ति यहां की मशहूर जगह है.

      अपडेट किया गया प्रॉम्प्ट बेहतर जवाब

      लैंडमार्क के साथ शहर का पता लगाएं.

      कॉलोसियम

      शहर: रोम, लैंडमार्क: कोलेसियम.

      फ़ॉरबिडन सिटी

      शहर: बीजिंग, लैंडमार्क: फॉरबिडन सिटी

      निषिद्ध-शहर

      शहर: रियो डे जेनेरो, लैंडमार्क: क्राइस्ट द रिडीमर मूर्ति

      इसे सिलसिलेवार ढंग से बांटें

      ऐसे मुश्किल टास्क जिनमें विज़ुअल की समझ और रीज़निंग, दोनों की ज़रूरत होती है, ऐसे टास्क को छोटे और आसान चरणों में बांटना मददगार होता है. इसके अलावा, अगर मॉडल को सवाल में सीधे तौर पर “सिलसिलेवार तरीके से सोचने” के लिए कहा जाए, तो यह भी असरदार हो सकता है.

      प्रॉम्प्ट मॉडल रिस्पॉन्स

      टॉयलेट पेपर कब खत्म होगा?

      जल्द ही, आपके पास सिर्फ़ तीन रोल बचे हैं.

      अपडेट किया गया प्रॉम्प्ट बेहतर जवाब

        1. सबसे पहले, गिन लें कि इस तस्वीर में कितने टॉयलेट पेपर रोल दिखाए गए हैं.
        2. इसके बाद, यह तय करें कि एक आम व्यक्ति हर दिन कितना टॉयलेट पेपर इस्तेमाल करता है.
        3. हिसाब लगाएं कि टॉयलेट पेपर को कितनी देर तक खींचा जा सकता है.

        1. इस तस्वीर में टॉयलेट पेपर के तीन रोल हैं.
        2. एक आम व्यक्ति हर दिन टॉयलेट पेपर की करीब 20 शीट इस्तेमाल करता है.
        3. अगर हर रोल में 200 शीट हैं, तो हर रोल करीब 10 दिनों तक चलेगा. इसलिए, ये तीन रोल करीब एक महीने तक चलेंगे.

      गणित के या अन्य तरह के शाब्दिक (इबारती) सवाल, मॉडल को सिलसिलेवार तरीके से सोचने के लिए कहते हैं.

      प्रॉम्प्ट जवाब

      क्रम में चौथा पद क्या है?

      -135

      मॉडल से मिला जवाब गलत है. इसे बेहतर बनाने का कुछ तरीका यह है कि प्रॉम्प्ट का जवाब देने से पहले, मॉडल से समस्या को पार्स करने के लिए कहें.

      प्रॉम्प्ट जवाब

      पहले इमेज में दिए गए फ़ॉर्मूला को पार्स करें.

      इसके बाद, फ़ॉर्मूला के आधार पर, जवाब दें कि "क्रम में चौथा शब्द क्या है?".

      नतीजे को बड़ा करने के लिए क्लिक करें

      $$ b(n) = b(n-1) * (-3) $$

      $$ b(1) = 15 $$

      1. फ़ॉर्मूला में n = 4 की जगह मानें:
      2. $$ b(4) = b(4-1) * (-3) $$

        $$ b(4) = b(3) * (-3) $$

      3. हमें b(3) की वैल्यू नहीं पता. इसलिए, फ़ॉर्मूला में n = 3 की जगह दूसरा फ़ॉर्मूला डालें:
      4. $$ b(3) = b(3-1) * (-3) $$

        $$ b(3) = b(2) * (-3) $$

      5. हम b(2) की वैल्यू नहीं जानते. इसलिए, इस फ़ॉर्मूले में n = 2 की जगह इस्तेमाल करें:
      6. $$ b(2) = b(2-1) * (-3) $$

        $$ b(2) = b(1) * (-3) $$

      7. हम जानते हैं कि b(1) की वैल्यू 15 है. इसलिए, इसका फ़ॉर्मूला इस तरह तैयार करें:
      8. $$ b(2) = 15 * (-3) $$

        $$ b(2) = -45 $$

      9. अब हमें b(2) की वैल्यू पता है. इसलिए, इसे b(3) के फ़ॉर्मूले से बदलें:
      10. $$ b(3) = b(2) * (-3) $$

        $$ b(3) = -45 * (-3) $$

        $$ b(3) = 135 $$

      11. अब हमें b(3) की वैल्यू पता है. इसलिए, इसे b(4) के फ़ॉर्मूले से बदलें:
      12. $$ b(4) = b(3) * (-3) $$

        $$ b(4) = 135 * (-3) $$

        $$ b(4) = -405 $$

      इसलिए, इस क्रम में चौथा पद -405 है.

      मॉडल का यह जवाब सही है - अब रिस्पॉन्स को और बेहतर बनाने के लिए, मॉडल को सिलसिलेवार तरीके से सोचने के लिए कहा जा सकता है.

      अपडेट किया गया प्रॉम्प्ट बेहतर जवाब

      क्रम में चौथा पद क्या है? सिलसिलेवार तरीके से सोचें.

      पहला शब्द 15 है.

      दूसरा पद है b(1) * (-3) = 15 * (-3) = -45.

      तीसरा शब्द है b(2) * (-3) = -45 * (-3) = 135.

      चौथा शब्द b(3) * (-3) = 135 * (-3) = -405 है.

      आउटपुट फ़ॉर्मैट तय करके देखें

      एक आम समस्या यह है कि मॉडल आउटपुट का एक खास फ़ॉर्मैट (जैसे कि Markdown, JSON, एचटीएमएल) का फ़ॉर्मैट होना ज़रूरी है. ऐसा खास तौर पर तब होता है, जब मॉडल आउटपुट को डाउनस्ट्रीम टास्क से डेटा डाला जाना हो. प्रॉम्प्ट में मॉडल को निर्देश देकर, इस फ़ॉर्मैट में आउटपुट देने की कोशिश की जा सकती है. नीचे दो उदाहरण दिए गए हैं:

      प्रॉम्प्ट मॉडल रिस्पॉन्स

      इस इमेज में मौजूद टेबल को मार्कडाउन फ़ॉर्मैट में पार्स करें

      | विषय | स्थिति | समय | शुरू होने की तारीख | आखिरी तारीख |

      | ------- | ------ | ---- | -— | ------ |

      | गणित | हो गया | 1.5 घंटे | 29/11/2023 | 1/12/2023 |

      | देश या इलाका | हो गया | 30 मिनट | 2/12/2023 | 4/12/2023 |

      | फ़िज़िक्स | प्रोग्रेस | 2 घंटे | 3/12/2023 | 5/12/2023 |

      | बायोलॉजी | शुरू नहीं हुई | 6 घंटे | 2/11/2016 | 12/6/2023 |

      प्रॉम्प्ट मॉडल रिस्पॉन्स

      इन सभी एट्रिब्यूट की सूची दें:

      सामग्री, पकवान का प्रकार, शाकाहारी या नहीं, JSON फ़ॉर्मैट में

      ```json```

      {

      "ingredients": [

      "rice",

      "shrimp",

      "clams",

      "mussels",

      "peas",

      "tomatoes",

      "onions",

      "garlic",

      "olive oil",

      "paprika",

      "salt",

      "pepper"

      ],

      "type of cuisine": "Spanish",

      "vegetarian": false

      एक इमेज वाले प्रॉम्प्ट के लिए, अपनी इमेज को पहले रखें

      Gemini, प्रॉम्प्ट में इमेज और टेक्स्ट को किसी भी क्रम में समझ सकता है. हालांकि, टेक्स्ट प्रॉम्प्ट से पहले एक इमेज रखने से बेहतर नतीजे मिल सकते हैं. नीचे दिए गए सैंपल में, आपको दिखेगा कि हर प्रॉम्प्ट में टेक्स्ट से पहले इमेज है.

      मल्टीमोडल प्रॉम्प्ट से जुड़ी समस्या हल करना

      अगर आपको मददगार जवाब नहीं मिलता है, तो आपको अपने सवाल से जुड़ी समस्या को हल करना पड़ सकता है. यहां कुछ ऐसी रणनीतियां दी गई हैं जिन्हें आज़माया जा सकता है.

      अगर मॉडल, इमेज के काम के हिस्से से जानकारी नहीं बना रहा है

      ज़्यादा सटीक जवाब पाने के लिए, यह बताया जा सकता है कि प्रॉम्प्ट में जवाब देने के लिए किस इमेज से जानकारी ली जाए.

      प्रॉम्प्ट मॉडल रिस्पॉन्स

      बच्चे के ये डायपर कितने दिनों तक चल सकते हैं?

      डायपर खत्म होने से पहले, 198 दिनों तक चलते हैं.

      अपडेट किया गया प्रॉम्प्ट बेहतर जवाब

      मेरे खत्म होने से पहले, ये डायपर कितनी देर तक काम करेंगे?

      बॉक्स पर दिखाए गए वज़न का इस्तेमाल करके बच्चे की उम्र पता करें. साथ ही, बॉक्स में मौजूद डायपर की कुल संख्या बताएं.

      कुल संख्या को इस संख्या से भाग देने पर, आपके बच्चे को हर दिन कितने डायपर मिले.

      बॉक्स में 198 डायपर हैं. बॉक्स में लिखा है कि डायपर 22-37 पाउंड वज़न वाले बच्चे के लिए हैं.

      इस वज़न की सीमा में आने वाले बच्चे की औसत उम्र 1 से 2 साल के बीच हो सकती है.

      आम तौर पर, दो साल के बच्चे का डायपर हर दिन छह डायपर से गुज़रता है. इसलिए, डायपर करीब 33 दिनों (198/6) तक चलेगा.

      अगर मॉडल आउटपुट बहुत जेनरिक है और इमेज इनपुट के मुताबिक नहीं है

      इमेज के हिसाब से जवाब तैयार करने में मॉडल की मदद करने के लिए, तर्क वाला टास्क करने से पहले, उससे इमेज के बारे में बताने के लिए कहें.

      प्रॉम्प्ट मॉडल रिस्पॉन्स

      इन इमेज में क्या समानता है?

      ये चारों इमेज, लैंडस्केप फ़ोटोग्राफ़ी के उदाहरण हैं.

      अपडेट किया गया प्रॉम्प्ट बेहतर जवाब

      सबसे पहले, बताएं कि हर इमेज में क्या है. इन इमेज में क्या समानता है?

      पहली इमेज में एक व्यक्ति सूटकेस पैक करते हुए दिख रहा है. दूसरी इमेज में शॉपिंग मॉल का एक खाली गलियारा दिखाया गया है. तीसरी इमेज में टॉयलेट पेपर का एक रोल दिखाया गया है. चौथी इमेज में गहरे और तूफ़ानी समुद्र को दिखाया गया है.

      इन इमेज में एक समानता यह है कि ये सभी लिमिनल स्पेस के उदाहरण हैं. लिमिनल स्पेस ऐसी जगहों या स्थितियों को कहते हैं जो दो अन्य जगहों या स्थितियों के बीच में होती हैं. इस तरह के सवाल अक्सर कुछ साफ़ तौर पर समझ नहीं आते या वे तुरंत समझ नहीं आते.

      पहली इमेज में व्यक्ति को घर पर हैं और यात्रा के बीच में दिखाया गया है. दूसरी इमेज में दो स्टोर के बीच का गलियारा दिखाया गया है. तीसरी इमेज टॉयलेट पेपर की है, जो बाथरूम को दिखा सकता है. बाथरूम, निजी और सार्वजनिक जगहों के बीच के बीच की जगह है. यह एक ऐसी जगह है जहां हम बाहर की दुनिया में जाने या उसे छोड़ने के लिए खुद को तैयार करते हैं.

      चौथी इमेज में शांत और तूफ़ानी होने के बीच समुद्र को दिखाया गया है.

      सीमित जगहें, रोमांचक और विचलित करने वाली हो सकती हैं. वे एक नई शुरुआत या अंत का स्थान हो सकते हैं. वे विचार या गतिविधि का एक स्थान हो सकते हैं.

      आप मॉडल को साफ़ तौर पर यह बताने के लिए भी कह सकते हैं कि इमेज में क्या मौजूद है.

      अपडेट किया गया प्रॉम्प्ट बेहतर जवाब

      इन इमेज में क्या समानता है? देखें कि इमेज में क्या जवाब दिया गया है.

      सभी इमेज यात्रा से जुड़ी हैं. पहली इमेज में एक व्यक्ति सूटकेस पैक करते हुए दिख रहा है. दूसरी इमेज में शॉपिंग मॉल का खाली गलियारा, तीसरी इमेज में टॉयलेट पेपर का एक ढेर, और चौथी इमेज में गहरे और तूफ़ानी समुद्र को दिखाया गया है.

      ये सभी इमेज, यात्रा से जुड़ी हैं. ऐसा इसलिए है, क्योंकि सफ़र के दौरान लोगों को इनकी ज़रूरत या इस्तेमाल के बारे में जानकारी मिलती है. पहली इमेज में एक व्यक्ति सूटकेस पैक करता हुआ दिख रहा है. यह कुछ ऐसा है जिसे लोग यात्रा पर जाते समय करते हैं. दूसरी इमेज में शॉपिंग मॉल का एक खाली गलियारा दिखाया गया है. यह वह जगह है जहां लोग यात्रा के लिए अक्सर चीज़ें खरीदने जाते हैं. तीसरी इमेज में टॉयलेट पेपर का एक ढेर दिखाया गया है. इसे अक्सर लोग यात्रा करते समय इस्तेमाल करते हैं. चौथी इमेज में अंधेरा और तूफ़ानी समुद्र दिखाया गया है. यह ऐसा कुछ है जिसका सामना अक्सर लोग यात्रा करते समय करते हैं.

      यही सलाह, इमेज से क्रिएटिव आउटपुट लेने के लिए भी काम करती है. खरगोश के साथ नीचे दिए गए उदाहरण में, मॉडल से साफ़ तौर पर इमेज के पहलुओं को शामिल करने के लिए कहने से आउटपुट को बेहतर बनाया जा सकता है.

      प्रॉम्प्ट मॉडल रिस्पॉन्स

      क्या तुम इस इमेज के बारे में मुझे एक कविता लिख सकते हो?

      छोटा खरगोश, बहुत मुलायम और भूरे रंग का,
      आप मैदान में ऊपर-नीचे हो रहे हैं.
      आपके कान इतने लंबे हैं, आपकी पूंछ इतनी छोटी है,
      आप उन सभी में सबसे प्यारे जीव हैं.

      आप घास पर चबाते हैं, बहुत हरा और मीठा होता है,
      और जब आप मुझे देखते हैं, तो दूर चले जाते हैं.
      हालांकि,मैं हमेशा आपकी दोस्त बनी रहूंगी
      छोटा खरगोश, बहुत आखिर तक.

      अपडेट किया गया प्रॉम्प्ट बेहतर जवाब

      क्या तुम इस तस्वीर के बारे में एक ब्यौरा देने वाली और एक नाटकीय कविता लिख सकते हो और इसमें जगह की जानकारी भी शामिल कर सकते हो?

      हरे रंग पर छोटा खरगोश,
      कान कितने बड़े हैं, आप तैयार हैं.
      आपको वहां क्या दिखता है,
      दूर से, आप कहां देखते हैं?

      क्या समुद्र का रंग नीला है,
      धूप में चमक रही है?
      या लहरों का टकराना और उनकी गड़गड़ाहट,
      क्या आपको पसंद है?

      छोटा खरगोश, सच में बताओ,
      आपका ध्यान आकर्षित करने वाली चीज़ क्या है?
      क्या यह नमकीन हवा है,
      या सीगल का रोना कितना अच्छा है?

      शायद ये इन सब की अहमियत है,
      छोटी और बड़ी दुनिया.
      ऐसी जगह जहां सपने देखे जा सकते हैं,
      और रोमांच की कल्पना भी की जा सकती है.

      छोटा खरगोश, मैं सोच रही हूं कि तुम क्या सपने देखते हो,
      जब आप घास पर बैठते हैं, तब आप बहुत शांत रहते हैं.
      क्या आपकी दिलचस्पी गहरी जगहों को एक्सप्लोर करने,
      या ज़मीन पर रहने की है, जहां आप छलांग लगा सकें?

      चाहे आप कुछ भी हों, छोटा खरगोश,
      हैरान करने की वह चिंगारी बनाए रखें जिसे आप हमेशा चमकते रहें.
      आपके सपनों और आकांक्षाओं में,
      एक ऐसी दुनिया है जो आपके बनाए जाने का इंतज़ार कर रही है.

      उस समस्या को हल करना जो प्रॉम्प्ट का कौनसा हिस्सा पूरा नहीं हो सका

      यह पता लगाना मुश्किल हो सकता है कि कोई प्रॉम्प्ट पूरा नहीं हुआ या नहीं. इसकी वजह यह है कि मॉडल, शुरू करने के लिए इमेज को समझ नहीं पाया या वह इमेज को समझ नहीं पाया. हालांकि, बाद में वह इमेज के सही तर्क के चरणों को पूरा नहीं कर पाया.

      इन वजहों को साफ़ तौर पर बताने के लिए, मॉडल से इमेज में मौजूद कॉन्टेंट के बारे में बताने के लिए कहें.

      नीचे दिए गए उदाहरण में, अगर मॉडल जवाब में कुछ ऐसा स्नैक दिखाता है जो चाय (जैसे कि पॉपकॉर्न) के साथ खाने पर हैरान करने वाला लगता है, तो सबसे पहले यह पता लगाएं कि मॉडल ने इमेज में चाय शामिल की है या नहीं.

      प्रॉम्प्ट समस्या हल करने के लिए प्रॉम्प्ट

      मैं एक मिनट में कौनसा स्नैक बना सकती हूँ, जो इसके साथ अच्छा रहेगा?

      बताएं कि इस इमेज में क्या है.

      दूसरी रणनीति यह है कि मॉडल से उसकी वजह बताने के लिए कहें. इससे आपको यह तय करने में मदद मिल सकती है कि अगर कोई वजह हो, तो उसका कौनसा हिस्सा काम नहीं करेगा.

      प्रॉम्प्ट समस्या हल करने के लिए प्रॉम्प्ट

      मैं एक मिनट में कौनसा स्नैक बना सकती हूँ, जो इसके साथ अच्छा रहेगा?

      मैं एक मिनट में कौनसा स्नैक बना सकती हूँ, जो इसके साथ अच्छा रहेगा? कृपया इसकी वजह बताएं.

      सैंपलिंग के पैरामीटर में बदलाव करना

      हर अनुरोध में, आपको सिर्फ़ मल्टीमोडल प्रॉम्प्ट ही नहीं, बल्कि मॉडल को सैंपलिंग के पैरामीटर का एक सेट भी भेजना होता है. मॉडल, अलग-अलग पैरामीटर वैल्यू के लिए अलग-अलग नतीजे जनरेट कर सकता है. टास्क के लिए सबसे सही वैल्यू पाने के लिए, अलग-अलग पैरामीटर के साथ प्रयोग करें. आम तौर पर, इनमें बदलाव किए जाने वाले पैरामीटर की जानकारी नीचे दी गई है:

      • तापमान
      • टॉप-पी
      • टॉप-के

      तापमान

      जवाब देने के दौरान सैंपल लेने के लिए तापमान का इस्तेमाल किया जाता है. यह तब होता है, जब टॉप-P और टॉप-K लागू किए जाते हैं. टोकन चुनने में तापमान की रैंडमनेस की डिग्री को कंट्रोल किया जाता है. कम तापमान ऐसे प्रॉम्प्ट के लिए अच्छे होते हैं जिनके लिए ज़्यादा डिटर्मिनिस्टिक और कम ओपन-एंडेड या क्रिएटिव जवाब की ज़रूरत होती है. वहीं, ज़्यादा तापमान से अलग-अलग या क्रिएटिव नतीजे मिलते हैं. तापमान 0 होने का मतलब है कि सबसे ज़्यादा प्रॉबबिलिटी वाले रिस्पॉन्स को हमेशा चुना जाता है.

      ज़्यादातर मामलों में, तापमान 0.4 से शुरू करें. अगर आपको ज़्यादा क्रिएटिव नतीजे चाहिए, तो तापमान को बढ़ाएं. अगर आपको साफ़ तौर पर ग़लत जानकारी दिखती है, तो तापमान कम करें.

      टॉप-के

      Top-K, आउटपुट के लिए टोकन चुनने का तरीका बदलता है. 1 में से टॉप का मतलब है कि मॉडल की शब्दावली में सभी टोकन में से, चुना गया अगला टोकन सबसे ज़्यादा संभावित है. इसे ग्रीडी डिकोडिंग भी कहा जाता है. वहीं, 3 में से टॉप-K का मतलब है कि तापमान का इस्तेमाल करके, अगले टोकन को तीन सबसे सही टोकन में से चुना गया है.

      टोकन चुनने के हर चरण के लिए, सबसे ज़्यादा संभावना वाले टॉप-K टोकन का सैंपल लिया जाता है. इसके बाद, टॉप-पी के आधार पर टोकन को और फ़िल्टर किया जाता है. साथ ही, तापमान के नमूने का इस्तेमाल करके, फ़ाइनल टोकन को चुना जाता है.

      बिना क्रम के मिलने वाले कम जवाबों के लिए कम वैल्यू और किसी भी क्रम में मिलने वाले ज़्यादा जवाबों के लिए ज़्यादा वैल्यू तय करें. टॉप-K की डिफ़ॉल्ट वैल्यू 32 है.

      टॉप-पी

      टॉप-P, आउटपुट के लिए टोकन चुनने का तरीका बदलता है. टोकन सबसे ज़्यादा (टॉप-K देखें) में से चुने जाते हैं. ऐसा तब तक किया जाता है, जब तक कि उनकी प्रॉबबिलिटी का योग, टॉप-P वैल्यू के बराबर नहीं हो जाता. उदाहरण के लिए, अगर टोकन A, B, और C की 0.6, 0.3, 0.1 की संभावना है और टॉप-P वैल्यू 0.9 है, तो मॉडल तापमान का इस्तेमाल करके अगले टोकन के तौर पर A या B चुनेगा और C को कैंडिडेट के तौर पर शामिल नहीं करेगा.

      बिना क्रम के मिलने वाले कम जवाबों के लिए कम वैल्यू और किसी भी क्रम में मिलने वाले ज़्यादा जवाबों के लिए ज़्यादा वैल्यू तय करें. टॉप-पी की डिफ़ॉल्ट वैल्यू 1.0 है.

      अगले चरण