মিডিয়া ফাইলের সাথে প্রম্পটিং


Gemini API টেক্সট, ইমেজ, অডিও এবং ভিডিও ডেটা সহ প্রম্পটিং সমর্থন করে, যা মাল্টিমোডাল প্রম্পটিং নামেও পরিচিত, যার অর্থ আপনি আপনার প্রম্পটে এই ধরনের মিডিয়া ফাইলগুলি অন্তর্ভুক্ত করতে পারেন। ছোট ফাইলগুলির জন্য, আপনি প্রম্পট প্রদান করার সময় সরাসরি একটি স্থানীয় ফাইলে জেমিনি মডেল নির্দেশ করতে পারেন। প্রম্পটে অন্তর্ভুক্ত করার আগে ফাইল API এর সাথে বড় ফাইলগুলি আপলোড করুন৷

ফাইল API আপনাকে প্রতি প্রকল্পে 20GB পর্যন্ত ফাইল সংরক্ষণ করতে দেয়, প্রতিটি ফাইলের আকার 2GB-এর বেশি নয়। ফাইলগুলি 48 ঘন্টার জন্য সংরক্ষণ করা হয় এবং সেই সময়ের মধ্যে প্রজন্মের জন্য আপনার API কী দিয়ে অ্যাক্সেস করা যেতে পারে এবং API থেকে ডাউনলোড করা যাবে না। Gemini API পাওয়া যায় এমন সমস্ত অঞ্চলে Files API বিনা মূল্যে পাওয়া যায়।

ফাইল API ইনপুটগুলি পরিচালনা করে যা model.generateContent বা model.streamGenerateContent দিয়ে সামগ্রী তৈরি করতে ব্যবহার করা যেতে পারে। বৈধ ফাইল ফরম্যাট (MIME প্রকার) এবং সমর্থিত মডেলের তথ্যের জন্য, সমর্থিত ফাইল ফরম্যাট দেখুন।

এই গাইডটি দেখায় কিভাবে ফাইল API ব্যবহার করে মিডিয়া ফাইল আপলোড করতে হয় এবং সেগুলিকে Gemini API-তে GenerateContent কলে অন্তর্ভুক্ত করতে হয়। আরও তথ্যের জন্য, কোড নমুনা দেখুন।

সমর্থিত ফাইল ফরম্যাট

জেমিনি মডেল একাধিক ফাইল ফরম্যাটের সাথে প্রম্পটিং সমর্থন করে। এই বিভাগে প্রম্পট করার জন্য সাধারণ মিডিয়া ফরম্যাটগুলি ব্যবহার করার বিষয়ে বিবেচ্য বিষয়গুলি ব্যাখ্যা করে, বিশেষ করে ছবি, অডিও, ভিডিও এবং প্লেইন টেক্সট ফাইল৷ আপনি মিডিয়া ফাইলগুলিকে শুধুমাত্র নির্দিষ্ট মডেল সংস্করণের সাথে প্রম্পট করার জন্য ব্যবহার করতে পারেন, যেমনটি নিম্নলিখিত টেবিলে দেখানো হয়েছে।

মডেল ছবি শ্রুতি ভিডিও সরল পাঠ্য
Gemini 1.5 Pro (রিলিজ 008 এবং পরবর্তী) ✔ (সর্বোচ্চ 3600 ইমেজ ফাইল)
মিথুন প্রো ভিশন ✔ (সর্বোচ্চ ১৬টি ছবি ফাইল)

ইমেজ ফরম্যাট

আপনি gemini-pro-vision এবং gemini-1.5-pro মডেলগুলির সাথে প্রম্পট করার জন্য চিত্র ডেটা ব্যবহার করতে পারেন। আপনি যখন প্রম্পট করার জন্য ছবিগুলি ব্যবহার করেন, তখন সেগুলি নিম্নলিখিত সীমাবদ্ধতা এবং প্রয়োজনীয়তার সাপেক্ষে থাকে:

  • চিত্রগুলি অবশ্যই নিম্নলিখিত চিত্র ডেটা MIME প্রকারগুলির মধ্যে একটিতে থাকতে হবে:
    • PNG - ছবি/পিএনজি
    • JPEG - ছবি/jpeg
    • WEBP - ছবি/ওয়েবপি
    • HEIC - চিত্র/heic
    • HEIF - image/heif
  • gemini-pro-vision জন্য সর্বাধিক 16টি পৃথক ছবি এবং gemini-1.5-pro এর জন্য 3600টি ছবি
  • একটি ছবিতে পিক্সেল সংখ্যার কোন নির্দিষ্ট সীমা নেই; যাইহোক, বৃহত্তর চিত্রগুলিকে তাদের আসল আকৃতির অনুপাত সংরক্ষণ করার সময় সর্বাধিক 3072 x 3072 রেজোলিউশনে ফিট করার জন্য ছোট করা হয়।

অডিও ফরম্যাট

আপনি gemini-1.5-pro মডেলের সাথে প্রম্পট করার জন্য অডিও ডেটা ব্যবহার করতে পারেন। আপনি যখন প্রম্পট করার জন্য অডিও ব্যবহার করেন, তখন সেগুলি নিম্নলিখিত সীমাবদ্ধতা এবং প্রয়োজনীয়তার সাপেক্ষে থাকে:

  • অডিও ডেটা নিম্নলিখিত সাধারণ অডিও বিন্যাস MIME প্রকারে সমর্থিত:
    • WAV - অডিও/wav
    • MP3 - অডিও/mp3
    • AIFF - অডিও/এআইএফএফ
    • AAC - অডিও/aac
    • OGG Vorbis - অডিও/ogg
    • FLAC - অডিও/flac
  • একক প্রম্পটে অডিও ডেটার সর্বাধিক সমর্থিত দৈর্ঘ্য হল 9.5 ঘন্টা।
  • অডিও ফাইলগুলিকে 16 কেবিপিএস ডেটা রেজোলিউশনে পুনরায় স্যাম্পল করা হয় এবং অডিওর একাধিক চ্যানেল একটি একক চ্যানেলে একত্রিত হয়।
  • একটি একক প্রম্পটে অডিও ফাইলের সংখ্যার কোন নির্দিষ্ট সীমা নেই; যাইহোক, একটি একক প্রম্পটে সমস্ত অডিও ফাইলের মোট সম্মিলিত দৈর্ঘ্য 9.5 ঘন্টার বেশি হতে পারে না।

ভিডিও ফরম্যাট

আপনি gemini-1.5-pro মডেলের সাথে প্রম্পট করার জন্য ভিডিও ডেটা ব্যবহার করতে পারেন।

  • ভিডিও ডেটা নিম্নলিখিত সাধারণ ভিডিও বিন্যাস MIME প্রকারে সমর্থিত:

    • ভিডিও/mp4
    • ভিডিও/এমপিইজি
    • ভিডিও/মুভ
    • ভিডিও/এভি
    • ভিডিও/x-flv
    • ভিডিও/এমপিজি
    • ভিডিও/ওয়েবএম
    • ভিডিও/ডাব্লুএমভি
    • video/3gpp
  • ফাইল এপিআই পরিষেবা 1 ফ্রেম প্রতি সেকেন্ডে (এফপিএস) ভিডিওগুলিকে চিত্রগুলিতে নমুনা করে এবং সেরা অনুমান গুণমান প্রদানের জন্য পরিবর্তন করা হতে পারে৷ রেজোলিউশন এবং গুণমান নির্বিশেষে পৃথক ছবি 258 টোকেন নেয়।

প্লেইন টেক্সট ফরম্যাট

ফাইল API নিম্নলিখিত MIME প্রকারের সাথে প্লেইন টেক্সট ফাইল আপলোড করা সমর্থন করে:

  • টেক্সট/প্লেইন
  • টেক্সট/এইচটিএমএল
  • টেক্সট/সিএসএস
  • পাঠ্য/জাভাস্ক্রিপ্ট
  • অ্যাপ্লিকেশন/এক্স-জাভাস্ক্রিপ্ট
  • টেক্সট/এক্স-টাইপস্ক্রিপ্ট
  • অ্যাপ্লিকেশন/এক্স-টাইপস্ক্রিপ্ট
  • পাঠ্য/সিএসভি
  • পাঠ্য/মার্কডাউন
  • টেক্সট/এক্স-পাইথন
  • অ্যাপ্লিকেশন/এক্স-পাইথন-কোড
  • অ্যাপ্লিকেশন/জেসন
  • টেক্সট/এক্সএমএল
  • অ্যাপ্লিকেশন/আরটিএফ
  • টেক্সট/আরটিএফ

একটি MIME প্রকারের প্লেইন টেক্সট ফাইলগুলির জন্য যেগুলি তালিকায় নেই, আপনি উপরের MIME প্রকারগুলির একটি ম্যানুয়ালি নির্দিষ্ট করার চেষ্টা করতে পারেন৷