জেমিনি এপিআই দিয়ে দৃষ্টি ক্ষমতা অন্বেষণ করুন

Gemini API এটিতে পাস করা ছবি এবং ভিডিওগুলির উপর অনুমান চালাতে পারে। যখন একটি ছবি, ছবির একটি সিরিজ, বা একটি ভিডিও পাস করা হয়, তখন মিথুন করতে পারে:

  • বিষয়বস্তু সম্পর্কে প্রশ্নের বর্ণনা বা উত্তর দিন
  • বিষয়বস্তু সারসংক্ষেপ
  • বিষয়বস্তু থেকে Extrapolate

এই টিউটোরিয়ালটি চিত্র এবং ভিডিও ইনপুট সহ জেমিনি API প্রম্পট করার কিছু সম্ভাব্য উপায় প্রদর্শন করে। সমস্ত আউটপুট শুধুমাত্র পাঠ্য।

এরপর কি

এই গাইডটি দেখায় কিভাবে generateContent ব্যবহার করতে হয় এবং ইমেজ এবং ভিডিও ইনপুট থেকে টেক্সট আউটপুট তৈরি করতে হয়। আরও জানতে, নিম্নলিখিত সংস্থানগুলি দেখুন:

  • মিডিয়া ফাইলের সাথে প্রম্পটিং : জেমিনি API টেক্সট, ইমেজ, অডিও এবং ভিডিও ডেটা সহ প্রম্পটিং সমর্থন করে, যা মাল্টিমডাল প্রম্পটিং নামেও পরিচিত।
  • সিস্টেম নির্দেশাবলী : সিস্টেম নির্দেশাবলী আপনাকে আপনার নির্দিষ্ট প্রয়োজন এবং ব্যবহারের ক্ষেত্রের উপর ভিত্তি করে মডেলের আচরণ পরিচালনা করতে দেয়।
  • নিরাপত্তা নির্দেশিকা : কখনও কখনও জেনারেটিভ এআই মডেলগুলি অপ্রত্যাশিত আউটপুট তৈরি করে, যেমন আউটপুটগুলি ভুল, পক্ষপাতদুষ্ট বা আপত্তিকর। এই ধরনের আউটপুট থেকে ক্ষতির ঝুঁকি সীমিত করার জন্য পোস্ট-প্রসেসিং এবং মানব মূল্যায়ন অপরিহার্য।