জেমিনি এপিআই ছবি এবং ভিডিওগুলি প্রক্রিয়া করতে সক্ষম, যা অনেকগুলি উত্তেজনাপূর্ণ বিকাশকারী ব্যবহারের ক্ষেত্রে সক্ষম করে৷ মিথুনের কিছু দৃষ্টিশক্তির মধ্যে রয়েছে:
- ছবি সম্পর্কে ক্যাপশন এবং প্রশ্নের উত্তর দিন
- 2 মিলিয়ন টোকেন কনটেক্সট উইন্ডো পর্যন্ত দীর্ঘ নথি সহ পিডিএফগুলি প্রতিলিপি করুন এবং যুক্তি দিন৷
- 90 মিনিট পর্যন্ত দীর্ঘ ভিজ্যুয়াল ফ্রেম এবং অডিও সহ ভিডিওগুলি থেকে তথ্য বর্ণনা করুন, বিভাগ করুন এবং বের করুন
- একটি চিত্রে বস্তু সনাক্ত করুন এবং তাদের জন্য বাউন্ডিং বক্স স্থানাঙ্ক ফেরত দিন
এই টিউটোরিয়ালটি চিত্র এবং ভিডিও ইনপুট সহ জেমিনি API প্রম্পট করার কিছু সম্ভাব্য উপায় প্রদর্শন করে, কোড উদাহরণ প্রদান করে এবং মাল্টিমডাল দৃষ্টি ক্ষমতা সহ সর্বোত্তম অনুশীলনের প্রম্পট রূপরেখা দেয়। সমস্ত আউটপুট শুধুমাত্র পাঠ্য।
এরপর কি
এই গাইডটি কীভাবে চিত্র এবং ভিডিও ফাইলগুলি এপিআই ব্যবহার করে আপলোড করতে হয় এবং তারপরে চিত্র এবং ভিডিও ইনপুটগুলি থেকে পাঠ্য আউটপুট তৈরি করতে দেখায়। আরও জানতে, নিম্নলিখিত সংস্থানগুলি দেখুন:
- ফাইল প্রম্প্টিং কৌশলগুলি : জেমিনি এপিআই পাঠ্য, চিত্র, অডিও এবং ভিডিও ডেটা দিয়ে প্রম্পটকে সমর্থন করে, যা মাল্টিমোডাল প্রম্পটিং নামেও পরিচিত।
- সিস্টেমের নির্দেশাবলী : সিস্টেমের নির্দেশাবলী আপনাকে আপনার নির্দিষ্ট প্রয়োজন এবং ব্যবহারের ক্ষেত্রে ভিত্তিতে মডেলের আচরণ চালাতে দেয়।
- সুরক্ষা নির্দেশিকা : কখনও কখনও জেনারেটর এআই মডেলগুলি অপ্রত্যাশিত আউটপুট তৈরি করে, যেমন আউটপুটগুলি যা ভুল, পক্ষপাতদুষ্ট বা আপত্তিকর। এই জাতীয় ফলাফলগুলি থেকে ক্ষতির ঝুঁকি সীমাবদ্ধ করার জন্য পোস্ট-প্রসেসিং এবং মানব মূল্যায়ন প্রয়োজনীয়।