फ़ाइल से जुड़ी सूचना देने की रणनीतियां

Gemini की मदद से, आर्टिफ़िशियल इंटेलिजेंस (एआई) मॉडल का इस्तेमाल किया जा सकता है कई तरह का इनपुट डेटा शामिल है. जैसे, टेक्स्ट, इमेज, और ऑडियो. क्योंकि ये मॉडल एक से ज़्यादा टाइप या मोड डेटा का इस्तेमाल कर सकते हैं. Gemini मॉडल उन्हें मल्टीमॉडल मॉडल कहा जाता है या उन्हें मल्टीमॉडल क्षमताओं की तरह समझा जाता है.

इस पेज पर, ऐसी मीडिया फ़ाइलों को इस्तेमाल करने के दिशा-निर्देश और सबसे सही तरीके बताए गए हैं जो Gemini API के प्रॉम्प्ट होंगे. Gemini Files API का इस्तेमाल इन कामों के लिए कैसे किया जा सकता है, यह जानने के लिए मीडिया फ़ाइलें अपलोड करने और उन्हें अपने प्रॉम्प्ट में शामिल करने के लिए, देखें मीडिया फ़ाइलों के बारे में प्रॉम्प्ट.

प्रॉम्प्ट के साथ मीडिया फ़ाइलें इस्तेमाल करना

अपने प्रॉम्प्ट में अलग-अलग तरह के डेटा का इस्तेमाल करने की अनुमति मिलने पर, आपको ज़्यादा इसमें यह तय किया जा सकता है कि Gemini API की मदद से कौनसे काम किए जा सकते हैं. इसके लिए उदाहरण के लिए, आप मॉडल को स्वादिष्ट भोजन की फ़ोटो भेज सकते हैं और उसे लिखने के लिए कह सकते हैं भोजन के बारे में एक छोटा ब्लॉग.

प्रॉम्प्ट जवाब

इस तस्वीर के आधार पर एक छोटी और दिलचस्प ब्लॉग पोस्ट लिखो. इसे ऐसा होना चाहिए फ़ोटो में खाने का ब्यौरा शामिल करो और अपने सफ़र के बारे में बताओ खाना पकाने की तैयारी करना.


कुकी

खाना पकाने की तैयारी करना समय और पैसे बचाने का एक शानदार तरीका है. यह ये सेहतमंद खाने में आपकी मदद करते हैं. यह भोजन पौष्टिक खाने का एक अच्छा उदाहरण है और स्वादिष्ट भोजन जिसे आसानी से पहले से तैयार किया जा सकता है.

इस खाने में ब्राउन चावल, भुनी हुई सब्ज़ियां, और चिकन टेरियाकी शामिल हैं. ब्राउन राइस एक सेहत के लिए अच्छा और जटिल कार्बोहाइड्रेट होता है, जो आपको लगातार मिलने वाली ऊर्जा. भुनी हुई सब्ज़ियां रोज़ाना खाने का एक शानदार तरीका हैं की मात्रा में बहुत ज़्यादा विटामिन और मिनरल मिलते हैं. चिकन टेरियाकी स्वादिष्ट और इसमें ज़्यादा प्रोटीन होता है.

इस तरह के खाने को भी आसानी से बनाया जा सकता है. भूरे चावल को पकाएं, भूनें चिकन टेरियाकी पकाएं. जब सब कुछ पक जाए, इसे खाना पकाने के लिए डिब्बाबंद करते हैं और रेफ़्रिजरेटर में स्टोर करते हैं. फिर आप एक कंटेनर ले जाकर सुबह-सुबह घूमने जा सकते हैं!

अगर आपको पौष्टिक और स्वादिष्ट खाना चाहिए, तो समय से पहले पक जाने वाला यह खाना एक बेहतरीन विकल्प है. यह पैक किया हुआ है पोषक तत्व और स्वाद, और यह पक्का है कि आप भरा महसूस करें और तंदुरुस्ती महसूस करें.

पेश है पौष्टिक और स्वादिष्ट खाने की रेसिपी!

मीडिया का इस्तेमाल करके मैसेज भेजने की रणनीतियां

अगर आपको इस्तेमाल किए जाने वाले प्रॉम्प्ट से मनमुताबिक आउटपुट पाने में समस्या आ रही है मीडिया फ़ाइलें हैं, तो ऐसी कुछ रणनीतियां हैं जो आपको चाहते हैं. नीचे दिए गए सेक्शन में, डिज़ाइन करने के तरीके और समस्या हल करने के बारे में बताया गया है मल्टीमोडल इनपुट का इस्तेमाल करने वाले प्रॉम्प्ट को बेहतर बनाने के लिए सलाह.

मल्टीमोडल प्रॉम्प्ट को बेहतर बनाने के लिए, इन सबसे सही तरीकों को अपनाएं:

  • प्रॉम्प्ट डिज़ाइन से जुड़ी बुनियादी बातें

    • निर्देशों में साफ़ तौर पर जानकारी दें: साफ़ तौर पर और कम शब्दों में निर्देश दें, ताकि उनका गलत मतलब निकाला जा सके.
    • अपने प्रॉम्प्ट में कुछ उदाहरण जोड़ें: आपका लक्ष्य क्या है, यह बताने के लिए कुछ शॉट के साथ असली लगने वाले उदाहरणों का इस्तेमाल करें.
    • इसे सिलसिलेवार तरीके से बांटें: मुश्किल टास्क को ऐसे सब-लक्ष्यों में बांट दें जिन्हें मैनेज किया जा सकता है. इससे, मॉडल को गाइड करने की पूरी प्रक्रिया में मदद मिलती है.
    • आउटपुट का फ़ॉर्मैट तय करना: प्रॉम्प्ट में आउटपुट को अपनी पसंद के फ़ॉर्मैट में रखने का अनुरोध करें. जैसे, Markdown, JSON, HTML वगैरह.
    • एक इमेज वाले प्रॉम्प्ट के लिए, अपनी इमेज को पहले रखें: Gemini, इमेज और टेक्स्ट इनपुट को किसी भी क्रम में हैंडल कर सकता है. हालांकि, एक इमेज वाले प्रॉम्प्ट के लिए, यह बेहतर परफ़ॉर्म कर सकता है. ऐसा तब होता है, जब उस इमेज को टेक्स्ट प्रॉम्प्ट से पहले रखा जाए.
  • मल्टीमॉडल प्रॉम्प्ट से जुड़ी समस्या हल करना

    • अगर मॉडल, इमेज के सही हिस्से से जानकारी नहीं ले रहा है: यह संकेत छोड़ें कि आपको इमेज के किन हिस्सों से जानकारी हासिल करनी है.
    • अगर मॉडल का आउटपुट बहुत जेनरिक है (इमेज के हिसाब से नहीं बनाया गया है): प्रॉम्प्ट की शुरुआत में, टास्क की शुरुआत में, मॉडल को इमेज के बारे में बताने के लिए कहें. इसके अलावा, टास्क के लिए निर्देश देने से पहले, मॉडल को इमेज में मौजूद जानकारी के बारे में बताने के लिए कहें.

प्रॉम्प्ट के डिज़ाइन से जुड़ी बुनियादी बातें

इस सेक्शन में, पिछले सेक्शन में बताए गए सबसे सही तरीकों के बारे में ज़्यादा जानकारी दी गई है.

ध्यान दें: Gemini के इन उदाहरणों से मिले मॉडल के नतीजे, हर रन के हिसाब से अलग-अलग हो सकते हैं.

अपने निर्देशों में खास जानकारी दें

प्रॉम्प्ट में सबसे ज़्यादा तब सफलता मिलती है, जब वे साफ़ तौर पर और विस्तार से लिखे गए हों. अगर आपने कोई खास आउटपुट दिया है, तो बेहतर होगा कि आप प्रॉम्प्ट में उस शर्त को शामिल करें. इससे यह पक्का किया जा सकेगा कि आपको मनमुताबिक आउटपुट मिल रहा है.

कभी-कभी किसी सवाल का मकसद, उसे लिखने वाले व्यक्ति को साफ़ तौर पर लग सकता है, लेकिन असल में वह ज़्यादा सटीक नहीं होता. मॉडल के व्यवहार को पसंद के मुताबिक बनाने के लिए, यह देखें कि आपके प्रॉम्प्ट का गलत तरीके से क्या मतलब निकाला जा सकता है. साथ ही, पक्का करें कि आपके दिए गए निर्देश खास और साफ़ हों. जानकारी का गलत मतलब निकालने के लिए, बहुत कम जगह छोड़ें

एयरपोर्ट बोर्ड की इस इमेज के लिए, मॉडल से सिर्फ़ "इस इमेज के बारे में जानकारी देने" के लिए कहा जा रहा है सामान्य जानकारी जनरेट कर सकती है. अगर आपको इमेज से समय और शहर को पार्स करने के लिए मॉडल की ज़रूरत है, तो उस अनुरोध को सीधे अपने प्रॉम्प्ट में शामिल करें.

प्रॉम्प्ट मॉडल का जवाब

इस इमेज के बारे में बताएं.

इस इमेज में, एयरपोर्ट पर पहुंचने और जाने वाली फ़्लाइट की जानकारी देने वाला बोर्ड दिखाया गया है.

अपडेट किया गया प्रॉम्प्ट बेहतर जवाब
यात्रा की समय-सारणी

इस इमेज में दिखाए गए एयरपोर्ट बोर्ड से समय और शहर को एक सूची में पार्स करें.

  • 10:50 मॉस्को
  • 11:05 एडिनबर्ग
  • 11:05 लंदन
  • 11:10 बुखारेस्ट
  • 11:30 कीव
  • 11:35 डबलिन
  • 11:45 ईस्ट मिडलैंड्स
  • 12:15 सोफ़िया
  • 12:30 लंदन
  • 12:30 न्यूकैसल
  • 12:40 सेंट पीटर्सबर्ग
  • 12:40 लंदन
  • 12:45 मैनचेस्टर
  • कुछ उदाहरण जोड़ें

    Gemini मॉडल एक से ज़्यादा इनपुट स्वीकार कर सकता है. इनका इस्तेमाल यह समझने के लिए किया जा सकता है कि आउटपुट को आपकी पसंद के मुताबिक़ बनाया जा सकता है. इन उदाहरणों को जोड़ने से, मॉडल को पैटर्न की पहचान करने और दी गई इमेज और दिए गए जवाबों के बीच संबंध. इसे यह भी कहा जाता है "कुछ शॉट" सीखना.

    नीचे दिए गए उदाहरण में, शुरुआती आउटपुट में वाक्य के रूप में लिखा गया है और इसमें देश (ब्राज़ील). मान लें कि आपको आउटपुट को किसी अलग फ़ॉर्मैट या स्टाइल में रखना है और आपको सिर्फ़ शहर का है, देश नहीं. अपने प्रॉम्प्ट में कुछ शॉट के साथ उदाहरण जोड़ने से, मॉडल बेहतर हो सकता है आपकी पसंद के मुताबिक जवाब देने के लिए.

    प्रॉम्प्ट मॉडल रिस्पॉन्स
    यात्रा की समय-सारणी

    लैंडमार्क के साथ-साथ शहर को भी पहचानें.

    ब्राज़ील के रियो डि जेनेरो में, क्राइस्ट द रिडीमर की मूर्ति काफ़ी मशहूर है.

    अपडेट किया गया प्रॉम्प्ट बेहतर जवाब

    लैंडमार्क के साथ-साथ शहर को भी पहचानें.

    कोलसियम

    शहर: रोम, लैंडमार्क: कोलसियम.

    फ़ॉर्बिडन सिटी

    शहर: बीजिंग, लैंडमार्क: फॉरबिडन सिटी

    पाबंदी वाला शहर

    शहर: रियो डे जेनेरो, लैंडमार्क: क्राइस्ट द रिडीमर की मूर्ति

    इसे सिलसिलेवार ढंग से बांटें

    यह ऐप्लिकेशन ऐसे मुश्किल कामों में मददगार साबित हो सकता है जिनमें विज़ुअल समझने और रीज़निंग से जुड़े सवालों के जवाब शामिल हों टास्क को छोटे-छोटे और ज़्यादा आसान चरणों में बांटा जा सकता है. इसके अलावा, यह तरीका भी कारगर साबित हो सकता है, अगर अपने प्रॉम्प्ट में मॉडल को “सिलसिलेवार तरीके से सोचने” के लिए कहें.

    प्रॉम्प्ट मॉडल से मिला रिस्पॉन्स

    मेरा टॉयलेट पेपर कब खत्म हो जाएगा?

    जल्द ही, आपके लिए सिर्फ़ तीन रोल बचे हैं.

    अपडेट किया गया प्रॉम्प्ट बेहतर जवाब

      1. सबसे पहले, गिनें कि इस तस्वीर में कितने टॉयलेट पेपर रोल दिखाए गए हैं.
      2. इसके बाद, यह तय करें कि एक आम व्यक्ति हर दिन कितना टॉयलेट पेपर इस्तेमाल करता है.
      3. हिसाब लगाएं कि टॉयलेट पेपर के ये रोल कितनी देर तक चलेंगे.

      1. इस तस्वीर में टॉयलेट पेपर के तीन रोल दिख रहे हैं.
      2. एक आम व्यक्ति हर दिन टॉयलेट पेपर की करीब 20 शीट इस्तेमाल करता है.
      3. अगर हर रोल में 200 शीट हैं, तो हर रोल करीब 10 दिनों तक चलेगा. इसलिए, ये तीनों रोल करीब एक महीने तक चलेंगे.

    गणित के सवाल या अन्य तरह के शब्द वाले सवाल, मॉडल को सिलसिलेवार तरीके से सोचने के लिए कहने का अच्छा तरीका है.

    प्रॉम्प्ट जवाब

    क्रम का चौथा पद क्या है?

    -135

    मॉडल से मिला जवाब गलत है. इसे बेहतर बनाने के कुछ तरीके यह है कि प्रॉम्प्ट का जवाब देने से पहले, मॉडल को समस्या को पार्स करने के लिए कहें.

    प्रॉम्प्ट जवाब

    पहले इमेज में मौजूद फ़ॉर्मूला को पार्स करें.

    फिर, फ़ॉर्मूला के आधार पर, जवाब दें कि "क्रम में चौथा शब्द क्या है?".

    नतीजे को बड़ा करने के लिए क्लिक करें

    $$ b(n) = b(n-1) * (-3) $$

    $$ b(1) = 15 $$

    1. n = 4 को फ़ॉर्मूला में बदलें:
    2. $$ b(4) = b(4-1) * (-3) $$

      $$ b(4) = b(3) * (-3) $$

    3. हमें b(3) की वैल्यू नहीं पता है, इसलिए फ़ॉर्मूला में n = 3 को बदलें:
    4. $$ b(3) = b(3-1) * (-3) $$

      $$ b(3) = b(2) * (-3) $$

    5. हमें b(2) की वैल्यू नहीं पता है, इसलिए फ़ॉर्मूला में n = 2 बदलें:
    6. $$ b(2) = b(2-1) * (-3) $$

      $$ b(2) = b(1) * (-3) $$

    7. हमें पता है कि b(1) की वैल्यू 15 है, इसलिए इसे फ़ॉर्मूला में बदलें:
    8. $$ b(2) = 15 * (-3) $$

      $$ b(2) = -45 $$

    9. अब जब हमें b(2) की वैल्यू पता है, तो इसे b(3) के फ़ॉर्मूला में बदलें:
    10. $$ b(3) = b(2) * (-3) $$

      $$ b(3) = -45 * (-3) $$

      $$ b(3) = 135 $$

    11. अब जब हमें b(3) की वैल्यू पता है, तो इसे b(4) के फ़ॉर्मूला में बदलें:
    12. $$ b(4) = b(3) * (-3) $$

      $$ b(4) = 135 * (-3) $$

      $$ b(4) = -405 $$

    इसलिए, इस क्रम का चौथा पद -405 है.

    यह मॉडल रिस्पॉन्स सही है - अब जवाब को और भी बेहतर बनाने के लिए, मॉडल को सिलसिलेवार तरीके से सोचने के लिए कहा जा सकता है.

    अपडेट किया गया प्रॉम्प्ट बेहतर जवाब

    क्रम का चौथा पद क्या है? सिलसिलेवार तरीके से सोचें.

    पहला शब्द 15 है.

    दूसरा शब्द b(1) * (-3) = 15 * (-3) = -45 है.

    तीसरा टर्म है b(2) * (-3) = -45 * (-3) = 135.

    चौथा शब्द b(3) * (-3) = 135 * (-3) = -405 है.

    आउटपुट फ़ॉर्मैट तय करने की कोशिश करें

    एक सामान्य समस्या यह है कि मॉडल आउटपुट को किसी खास फ़ॉर्मैट (जैसे, Markdown, JSON, HTML) में होना चाहिए. खास तौर पर तब, जब मॉडल आउटपुट के लिए डाउनस्ट्रीम टास्क से डेटा डाला जा सकता है. प्रॉम्प्ट में मॉडल को निर्देश देकर, उस फ़ॉर्मैट में आउटपुट देने की कोशिश करें. नीचे दो उदाहरण दिए गए हैं:

    प्रॉम्प्ट मॉडल से मिला रिस्पॉन्स

    इस इमेज में मौजूद टेबल को मार्कडाउन फ़ॉर्मैट में पार्स करें

    | विषय | स्थिति | समय | शुरू होने की तारीख | आखिरी तारीख |

    | ------- | ------ | ---- | - जानी चाहिए | ------ |

    | गणित | हो गया | 1.5 घंटे | 29/11/2023 | 1/12/2023 |

    | देश या इलाका | हो गया | 30 मिनट | 2/12/2023 | 4/12/2023 |

    | भौतिकी | चल रहा है | 2 घंटे | 3/12/2023 | 5/12/2023 |

    | जीव विज्ञान | शुरू नहीं हुई | 6 घंटे | 2/11/2016 | 6/12/2023 |

    प्रॉम्प्ट मॉडल रिस्पॉन्स

    नीचे दिए गए सभी एट्रिब्यूट की सूची दें:

    सामग्री, व्यंजन का प्रकार, शाकाहारी या नहीं, JSON प्रारूप में

    ```json```

    {

    "ingredients": [

    "rice",

    "shrimp",

    "clams",

    "mussels",

    "peas",

    "tomatoes",

    "onions",

    "garlic",

    "olive oil",

    "paprika",

    "salt",

    "pepper"

    ],

    "type of cuisine": "Spanish",

    "vegetarian": false

    एक इमेज वाले प्रॉम्प्ट के लिए, अपनी इमेज को प्राथमिकता देना

    Gemini, प्रॉम्प्ट के ज़रिए इमेज और टेक्स्ट को किसी भी क्रम में समझ सकता है. साथ ही, एक ही इमेज का इस्तेमाल करके इससे पहले कि टेक्स्ट प्रॉम्प्ट बेहतर नतीजे दे सके. नीचे दिए गए सैंपल में, आपको हर प्रॉम्प्ट में टेक्स्ट से पहले आता है.

    मल्टीमोडल प्रॉम्प्ट से जुड़ी समस्या हल करना

    अगर आपको बेहतर जवाब नहीं मिल रहा है, तो हो सकता है कि आपको प्रॉम्प्ट की समस्या को हल करना पड़े. यहां कुछ रणनीतियां दी गई हैं, जिन्हें आप आज़मा सकते हैं.

    अगर मॉडल, इमेज के सही हिस्से से जानकारी नहीं ले रहा है

    ज़्यादा सटीक जवाब पाने के लिए, यह बताएं कि आपको इमेज के किन हिस्सों को प्रॉम्प्ट भेजना है इससे जानकारी निकाल सकते हैं.

    प्रॉम्प्ट मॉडल से मिला रिस्पॉन्स

    ये डायपर कितने दिनों तक बच्चे को चलेंगे?

    डायपर खत्म होने से पहले, यह 198 दिनों तक चलेगा.

    अपडेट किया गया प्रॉम्प्ट बेहतर जवाब

    ये डायपर खत्म होने से पहले, ये कितने समय तक चलेंगे?

    बच्चे की उम्र तय करने के लिए, बॉक्स पर दिखाए गए वज़न का इस्तेमाल करें और बॉक्स में डायपर की कुल संख्या इस्तेमाल करें.

    कुल संख्या को इस संख्या से भाग देने पर कि बच्चा हर दिन कितने डायपर पास करता है.

    बॉक्स में 198 डायपर हैं. बॉक्स में लिखा है कि डायपर 22-37 lbs वज़न वाले बच्चे के लिए हैं.

    इस वज़न सीमा में आम तौर पर बच्चा 1 से 2 साल की उम्र का हो सकता है.

    दो साल का डायपर, आम तौर पर हर दिन छह डायपर से गुज़रता है. इसलिए, यह डायपर 33 दिनों (198/6) तक चलेगा.

    अगर मॉडल का आउटपुट बहुत जेनरिक है और इमेज इनपुट के हिसाब से उसके मुताबिक नहीं है

    इमेज के हिसाब से जवाब तैयार करने में मॉडल की मदद करने के लिए, रीज़निंग से जुड़े टास्क करने से पहले, उससे इमेज के बारे में जानकारी देने के लिए कहें.

    प्रॉम्प्ट मॉडल से मिला रिस्पॉन्स

    इन इमेज में क्या समानता है?

    ये चारों इमेज लैंडस्केप फ़ोटोग्राफ़ी के उदाहरण हैं.

    अपडेट किया गया प्रॉम्प्ट बेहतर जवाब

    सबसे पहले, पूरी जानकारी दें कि हर इमेज में क्या है. इन इमेज में क्या समानता है?

    पहली इमेज में एक व्यक्ति सूटकेस पैक करते हुए दिख रहा है. दूसरी इमेज में शॉपिंग मॉल का एक खाली गलियारा दिखाया गया है. तीसरी इमेज में टॉयलेट पेपर का रोल दिखाया गया है. चौथी इमेज में, गहरे और तूफ़ानी समुद्र को दिखाया गया है.

    इन इमेज की समानता यह है कि ये सभी लिमिनल स्पेस के उदाहरण हैं. दो अन्य जगहों या स्थितियों के बीच में आने वाली जगहों को लिमिनल स्पेस कहा जाता है. अक्सर इन्हें अनिश्चितता या अस्पष्टता की वजह से मानी जाती है.

    पहली इमेज में व्यक्ति को दिखाया गया है कि वह घर पर है और यात्रा पर है. दूसरी इमेज में दो स्टोर के बीच का गलियारा दिखाया गया है. तीसरी इमेज टॉयलेट पेपर की है, जिसमें बाथरूम को दिखाया जा सकता है. बाथरूम, दो निजी कामों के लिए एक अलग जगह होती है सार्वजनिक जीवन में काम आ रहा है. यह एक ऐसी जगह है जहां हम खुद को बाहर की दुनिया में जाने या उससे बाहर जाने के लिए तैयार करते हैं.

    चौथी इमेज में समुद्र को शांत और तूफ़ानी होने के बीच दिखाया गया है.

    छोटे-छोटे स्पेस, रोमांचक और विचलित करने वाले, दोनों हो सकते हैं. यह एक नई शुरुआत या अंत का स्थान हो सकता है. ये चिंतन या क्रिया का स्थान हो सकते हैं.

    आपके पास, मॉडल को इमेज में मौजूद कॉन्टेंट का ज़िक्र करने के लिए कहने की भी कोशिश करने का विकल्प है.

    अपडेट किया गया प्रॉम्प्ट बेहतर जवाब

    इन इमेज में क्या समानता है? देखें कि आपके जवाब में मौजूद इमेज में क्या है.

    ये सभी तस्वीरें यात्रा से जुड़ी हैं. पहली इमेज में एक व्यक्ति को सूटकेस पैक करते हुए दिखाया गया है. दूसरी इमेज में दिखाया गया है शॉपिंग मॉल के एक खाली गलियारे की इमेज. तीसरी इमेज में टॉयलेट पेपर का ढेर दिखाया गया है. चौथी इमेज में गहरा और तूफ़ानी समुद्र.

    ये सभी इमेज यात्रा से संबंधित हैं, क्योंकि ये वे सभी चीज़ें हैं जिनकी लोगों को ज़रूरत है या जब वे इनका इस्तेमाल करते हैं वे कैसे सफ़र करते हैं. पहली इमेज में एक व्यक्ति को सूटकेस पैक करते हुए दिखाया गया है. यह ऐसा काम है जिसे लोग तब करते हैं, जब वे यात्रा पर जा रहे हैं. दूसरी इमेज में शॉपिंग मॉल का एक खाली गलियारा दिखाया गया है. यह वह जगह है जहां लोग अक्सर अपनी यात्राओं के लिए चीज़ें खरीदने जाते हैं. तीसरी इमेज में टॉयलेट पेपर का ढेर दिखाया गया है. इसमें जिनका इस्तेमाल लोग अक्सर यात्रा करते समय करते हैं. चौथी इमेज में गहरे और तूफ़ानी समुद्र को दिखाया गया है, जो कुछ ऐसा जो यात्रा के दौरान लोग अक्सर देखते हैं.

    ये सुझाव, इमेज से क्रिएटिव कॉन्टेंट बनाने के लिए भी काम करते हैं. नीचे दिए गए उदाहरण में, खरगोश, साफ़ तौर पर मॉडल से इमेज के पहलुओं को शामिल करने के लिए कह सकता है. इससे आउटपुट बेहतर हो सकता है.

    प्रॉम्प्ट मॉडल से मिला रिस्पॉन्स

    क्या तुम इस इमेज के बारे में एक कविता लिख सकते हो?

    छोटा खरगोश, जो मुलायम और भूरे रंग का हो,
    मैदान में ऊपर और नीचे उछलना.
    अभी तक किसी भी व्यक्ति ने चेक इन नहीं किया है आपके कान इतने लंबे हैं, तुम्हारी पूंछ इतनी छोटी,
    तुम इन सबसे प्यारी हो.

    आप घास पर चबाते हैं, बहुत हरी और मीठी,
    और जब तुम मुझे मिलो, तो तुम कहीं दूर हो जाओ.
    अभी तक किसी भी व्यक्ति ने चेक इन नहीं किया है लेकिन मैं हमेशा आपकी दोस्त रहूँगी,
    आखिर तक, छोटा-सा खरगोश.

    अपडेट किया गया प्रॉम्प्ट बेहतर जवाब

    क्या तुम इस इमेज के बारे में एक ऐसी कविता लिख सकते हो जो कि पूरी जानकारी देती हो और जिसमें जगह की जानकारी भी शामिल हो?

    हरे रंग में छोटा खरगोश,
    कान बहुत लंबे हैं, बहुत दिलचस्प.
    अभी तक किसी भी व्यक्ति ने चेक इन नहीं किया है तुम्हें वहां क्या दिखता है,
    दूर से, कहां घूरती है?

    क्या यह समुद्र का नीला है,
    क्या यह सूरज की रोशनी में चमक रहा है?
    अभी तक किसी भी व्यक्ति ने चेक इन नहीं किया है इसके अलावा, वे लहरें जो टकराती हैं और दहलाती हैं,
    क्या कोई धुन आपको पसंद है?

    छोटा खरगोश, सच कहो,
    आपका ध्यान इस ओर क्यों आकर्षित होता है?
    अभी तक किसी भी व्यक्ति ने चेक इन नहीं किया है क्या यह नमकीन हवा है,
    या सीगल प्लीज़ रोओ?

    शायद इन सबके बीच का रिश्ता है,
    एक बड़ी और छोटी दुनिया.
    अभी तक किसी भी व्यक्ति ने चेक इन नहीं किया है ऐसी जगह जहां सपने आ सकते हैं,
    साथ ही, इसमें रोमांच की भी शुरुआत की जा सकती है.

    छोटा खरगोश, सोच रहा हूं तुम क्या सपने देखती हो,
    जब आप घास पर बैठें, तो बहुत शांत.
    अभी तक किसी भी व्यक्ति ने चेक इन नहीं किया है क्या आपको गहरे रहस्यों के बारे में जानना है,
    या उस ज़मीन पर रहें, जहां आप छलांग लगा सकते हैं?

    चाहे कुछ भी हो, छोटा खरगोश,
    रोमांच की उस चिंगारी को लगातार जलते रहें.
    अभी तक किसी भी व्यक्ति ने चेक इन नहीं किया है आपके सपनों और सपनों में,
    आपके निर्माण की प्रतीक्षा कर रही दुनिया में झूठ.

    समस्या हल करना कि प्रॉम्प्ट का कौनसा हिस्सा पूरा नहीं हो सका

    यह पता लगाना मुश्किल हो सकता है कि प्रॉम्प्ट फ़ेल हुआ या नहीं, क्योंकि शुरू करने से इमेज को समझ नहीं आया या इमेज को समझ नहीं पाया, लेकिन इसके बाद, रीज़निंग से जुड़े चरणों को सही तरीके से लागू नहीं किया गया.

    इन वजहों के बीच फ़र्क़ करने के लिए, मॉडल से यह बताने के लिए कहें कि इमेज में क्या है.

    नीचे दिए गए उदाहरण में, अगर मॉडल एक ऐसे स्नैक्स के साथ जवाब देता है, जिसके साथ जोड़े जाने पर वह मज़ेदार लगता है चाय (जैसे कि पॉपकॉर्न) पर शेयर किया जाता है, तो सबसे पहले समस्या हल करके यह पता लगाया जा सकता है कि मॉडल सही तरीके से पहचाना गया है या नहीं इमेज में चाय मौजूद है.

    प्रॉम्प्ट समस्या हल करने के लिए निर्देश

    मेरे पास एक मिनट में कौनसा नाश्ता बनाना है, यह सही रहेगा?

    बताएं कि इस इमेज में क्या है.

    दूसरी रणनीति यह है कि मॉडल से उसकी वजह बताने के लिए कहा जाए. इससे आपको यह पता लगाने में मदद मिल सकती है कि अगर कोई वजह बताई गई है, तो कौनसी गड़बड़ी हुई है.

    प्रॉम्प्ट समस्या हल करने के लिए निर्देश

    मेरे पास एक मिनट में कौनसा नाश्ता बनाना है, यह सही रहेगा?

    मेरे पास एक मिनट में कौनसा नाश्ता बनाना है, यह सही रहेगा? कृपया इसकी वजह बताएं.

    प्रतिचयन पैरामीटर ट्यून करना

    हर अनुरोध में, मॉडल को सिर्फ़ मल्टीमोडल प्रॉम्प्ट ही नहीं, बल्कि सैंपलिंग पैरामीटर का भी सेट भेजा जाता है. मॉडल, अलग-अलग पैरामीटर वैल्यू के लिए अलग-अलग नतीजे जनरेट कर सकता है. अलग-अलग तरह के पैरामीटर का इस्तेमाल करें, ताकि आपको टास्क के लिए सबसे सही वैल्यू मिल सके. आम तौर पर, अडजस्ट किए जाने वाले पैरामीटर ये हैं:

    • तापमान
    • टॉप-पी
    • टॉप के

    तापमान

    तापमान का इस्तेमाल, रिस्पॉन्स जनरेट करने के दौरान सैंपलिंग के लिए किया जाता है. यह तब होता है, जब टॉप-P और टॉप-K को लागू किया जाता है. तापमान की मदद से, टोकन चुनने में किसी भी तरह की गड़बड़ी को कंट्रोल किया जाता है. तापमान कम करना ऐसे प्रॉम्प्ट के लिए अच्छा है ज़्यादा डिटरमिनिस्टिक और कम ओपन-एंडेड या क्रिएटिव रिस्पॉन्स की ज़रूरत होती है. वहीं, ज़्यादा तापमान का इस्तेमाल करने पर विविधता या क्रिएटिव तरीके से. 0 तापमान डिटर्मिनिस्टिक होता है. इसका मतलब है कि प्रॉबबिलिटी की सबसे ज़्यादा प्रतिक्रिया हमेशा चुना जाता है.

    ज़्यादातर मामलों में, तापमान 0.4 से शुरू करके देखें. अगर आपको ज़्यादा क्रिएटिव नतीजे चाहिए, तो तापमान. अगर आपको ठीक से नहीं दिख रहा है, तो तापमान को कम करके देखें.

    टॉप-के

    Top-K, मॉडल के आउटपुट के लिए टोकन चुनने के तरीके को बदलता है. 1 में से टॉप-K का मतलब है कि अगला चुना गया टोकन यह है इस मॉडल के शब्दावली में मौजूद सभी टोकन में से सबसे ज़्यादा संभावना है (इसे ग्रीडी डिकोडिंग भी कहा जाता है), जबकि 3 में से टॉप-K का मतलब है कि अगला टोकन, तापमान का इस्तेमाल किया जा रहा है.

    टोकन चुनने के हर चरण के लिए, सबसे ज़्यादा संभावना वाले टॉप-K टोकन का सैंपल लिया जाता है. इसके बाद टोकन को टॉप-पी के हिसाब से और फ़िल्टर किया जाता है. इसमें टॉप-P के हिसाब से आखिरी टोकन चुना जाता है. इसके लिए, टेंपरेचर सैंपलिंग का इस्तेमाल किया जाता है.

    कम बेतरतीब जवाबों के लिए कम मान और ज़्यादा रैंडम जवाबों के लिए ज़्यादा मान तय करें. टॉप-K की डिफ़ॉल्ट वैल्यू 32 है.

    टॉप-पी

    टॉप-P, आउटपुट के लिए टोकन चुनने के तरीके को बदलता है. सबसे ज़्यादा टोकन में से चुना गया है (टॉप-K देखें) तब तक कम से कम संभावित रखे जाते हैं, जब तक उनकी प्रायिकताओं का योग टॉप-P मान के बराबर न हो. उदाहरण के लिए, अगर टोकन A, B, और C की संभावना 0.6, 0.3, 0.1 है और टॉप-P वैल्यू 0.9 है, तो मॉडल तापमान का इस्तेमाल करके, A या B को अगले टोकन के तौर पर चुनें. साथ ही, C को छोड़ दें.

    कम बेतरतीब जवाबों के लिए कम मान और ज़्यादा रैंडम जवाबों के लिए ज़्यादा मान तय करें. टॉप-P की डिफ़ॉल्ट वैल्यू 1.0 है.

    अगले चरण