Gemini API की मदद से देखने से जुड़ी सुविधाओं के बारे में जानें

ai.google.dev पर देखें Google Colab में चलाएं GitHub पर सोर्स देखें

Gemini API, उसे पास की गई इमेज और वीडियो का अनुमान लगा सकता है. अगर कोई इमेज, इमेज की सीरीज़ या वीडियो पास किया जाता है, तो Gemini ये काम कर सकता है:

  • कॉन्टेंट से जुड़े सवालों के जवाब दें या बताएं
  • कॉन्टेंट की खास जानकारी दें
  • कॉन्टेंट से विश्लेषण करें

इस ट्यूटोरियल में, इमेज और वीडियो इनपुट की मदद से Gemini API को प्रॉम्प्ट देने के कुछ संभावित तरीके बताए गए हैं. सभी आउटपुट सिर्फ़ टेक्स्ट के तौर पर होंगे.

आगे क्या करना है

इस गाइड में generateContent को इस्तेमाल करने और इमेज और वीडियो इनपुट से टेक्स्ट आउटपुट जनरेट करने का तरीका बताया गया है. ज़्यादा जानने के लिए, नीचे दिए गए संसाधन देखें:

  • मीडिया फ़ाइलों से प्रॉम्प्ट देना: Gemini API के साथ, टेक्स्ट, इमेज, ऑडियो, और वीडियो डेटा के ज़रिए प्रॉम्प्ट दिए जा सकते हैं. इसे मल्टीमॉडल प्रॉम्प्ट भी कहा जाता है.
  • सिस्टम से जुड़े निर्देश: सिस्टम के निर्देशों की मदद से, अपनी खास ज़रूरतों और इस्तेमाल के उदाहरणों के आधार पर मॉडल के व्यवहार को कंट्रोल किया जा सकता है.
  • सुरक्षा के लिए दिशा-निर्देश: कभी-कभी जनरेटिव एआई मॉडल से ऐसे आउटपुट मिलते हैं जो उम्मीद के मुताबिक नहीं होते. जैसे, गलत, भेदभाव वाले या आपत्तिजनक आउटपुट. ऐसे आउटपुट से होने वाले नुकसान के खतरे को कम करने के लिए, पोस्ट-प्रोसेसिंग और मानवीय मूल्यांकन ज़रूरी है.