Gemini API की मदद से, दस्तावेज़ को प्रोसेस करने से जुड़ी सुविधाओं के बारे में जानें

Gemini API, उसे भेजे गए PDF दस्तावेज़ों को प्रोसेस कर सकता है और उन पर अनुमान लगा सकता है. PDF अपलोड होने पर, Gemini API ये काम कर सकता है:

  • कॉन्टेंट के बारे में बताना या उससे जुड़े सवालों के जवाब देना
  • कॉन्टेंट की खास जानकारी देना
  • कॉन्टेंट से अनुमान लगाना

इस ट्यूटोरियल में, दिए गए PDF दस्तावेज़ों के साथ Gemini API को प्रॉम्प्ट करने के कुछ संभावित तरीके दिखाए गए हैं. पूरा आउटपुट सिर्फ़ टेक्स्ट में होता है.

आगे क्या करना है

इस गाइड में, generateContent का इस्तेमाल करने और प्रोसेस किए गए दस्तावेज़ों से टेक्स्ट आउटपुट जनरेट करने का तरीका बताया गया है. ज़्यादा जानने के लिए, ये संसाधन देखें:

  • फ़ाइल के लिए प्रॉम्प्ट करने की रणनीतियां: Gemini API, टेक्स्ट, इमेज, ऑडियो, और वीडियो डेटा के साथ प्रॉम्प्ट करने की सुविधा देता है. इसे मल्टीमॉडल प्रॉम्प्ट भी कहा जाता है.
  • सिस्टम के निर्देश: सिस्टम के निर्देशों की मदद से, अपनी ज़रूरतों और इस्तेमाल के उदाहरणों के आधार पर, मॉडल के व्यवहार को कंट्रोल किया जा सकता है.
  • सुरक्षा से जुड़े दिशा-निर्देश: कभी-कभी जनरेटिव एआई मॉडल, अनचाहे आउटपुट देते हैं. जैसे, गलत, पक्षपातपूर्ण या आपत्तिजनक आउटपुट. ऐसे आउटपुट से होने वाले नुकसान को कम करने के लिए, पोस्ट-प्रोसेसिंग और मानवीय आकलन ज़रूरी है.