Gemini API দিয়ে অডিও ক্ষমতাগুলি অন্বেষণ করুন৷

মিথুন অডিও সম্বন্ধে প্রম্পটে সাড়া দিতে পারে। উদাহরণস্বরূপ, মিথুন করতে পারেন:

  • অডিও বিষয়বস্তু সম্পর্কে বর্ণনা, সারসংক্ষেপ বা প্রশ্নের উত্তর দিন।
  • অডিও একটি প্রতিলিপি প্রদান.
  • অডিওর একটি নির্দিষ্ট অংশ সম্পর্কে উত্তর বা ট্রান্সক্রিপশন প্রদান করুন।

এই নির্দেশিকা বিভিন্ন উপায় প্রদর্শন করে:

  • মিথুন মডেলের কাছে অডিও পাঠান।
  • মিথুন মডেলকে অডিও সম্পর্কে অনুরোধ করুন।

সমর্থিত অডিও ফরম্যাট

জেমিনি নিম্নলিখিত অডিও ফর্ম্যাট MIME প্রকারগুলিকে সমর্থন করে:

  • WAV - অডিও/wav
  • MP3 - অডিও/mp3
  • AIFF - অডিও/এআইএফএফ
  • AAC - অডিও/aac
  • OGG Vorbis - অডিও/ogg
  • FLAC - অডিও/flac

অডিও সম্পর্কে প্রযুক্তিগত বিবরণ

মিথুন অডিওতে নিম্নলিখিত নিয়মগুলি আরোপ করে:

  • মিথুন অডিওর প্রতিটি সেকেন্ড 25 টোকেন হিসাবে উপস্থাপন করে; উদাহরণস্বরূপ, এক মিনিটের অডিওকে 1,500 টোকেন হিসাবে উপস্থাপন করা হয়।
  • মিথুন শুধুমাত্র ইংরেজি ভাষার বক্তৃতার প্রতিক্রিয়া অনুমান করতে পারে।
  • মিথুন অ-বক্তৃতা উপাদান "বুঝতে" পারে, যেমন পাখির গান বা সাইরেন।
  • একক প্রম্পটে অডিও ডেটার সর্বাধিক সমর্থিত দৈর্ঘ্য হল 9.5 ঘন্টা। মিথুন একটি একক প্রম্পটে অডিও ফাইলের সংখ্যা সীমাবদ্ধ করে না; যাইহোক, একটি একক প্রম্পটে সমস্ত অডিও ফাইলের মোট সম্মিলিত দৈর্ঘ্য 9.5 ঘন্টার বেশি হতে পারে না।
  • Gemini অডিও ফাইলগুলিকে 16 Kbps ডেটা রেজোলিউশনে নমুনা দেয়।
  • অডিও উৎসে একাধিক চ্যানেল থাকলে, জেমিনি সেই চ্যানেলগুলিকে একক চ্যানেলে একত্রিত করে।
,

মিথুন অডিও সম্বন্ধে প্রম্পটে সাড়া দিতে পারে। উদাহরণস্বরূপ, মিথুন করতে পারেন:

  • অডিও বিষয়বস্তু সম্পর্কে বর্ণনা, সারসংক্ষেপ বা প্রশ্নের উত্তর দিন।
  • অডিও একটি প্রতিলিপি প্রদান.
  • অডিওর একটি নির্দিষ্ট অংশ সম্পর্কে উত্তর বা ট্রান্সক্রিপশন প্রদান করুন।

এই নির্দেশিকা বিভিন্ন উপায় প্রদর্শন করে:

  • মিথুন মডেলের কাছে অডিও পাঠান।
  • মিথুন মডেলকে অডিও সম্পর্কে অনুরোধ করুন।

সমর্থিত অডিও ফরম্যাট

জেমিনি নিম্নলিখিত অডিও ফর্ম্যাট MIME প্রকারগুলিকে সমর্থন করে:

  • WAV - অডিও/wav
  • MP3 - অডিও/mp3
  • AIFF - অডিও/এআইএফএফ
  • AAC - অডিও/aac
  • OGG Vorbis - অডিও/ogg
  • FLAC - অডিও/flac

অডিও সম্পর্কে প্রযুক্তিগত বিবরণ

মিথুন অডিওতে নিম্নলিখিত নিয়মগুলি আরোপ করে:

  • মিথুন অডিওর প্রতিটি সেকেন্ড 25 টোকেন হিসাবে উপস্থাপন করে; উদাহরণস্বরূপ, এক মিনিটের অডিওকে 1,500 টোকেন হিসাবে উপস্থাপন করা হয়।
  • মিথুন শুধুমাত্র ইংরেজি ভাষার বক্তৃতার প্রতিক্রিয়া অনুমান করতে পারে।
  • মিথুন অ-বক্তৃতা উপাদান "বুঝতে" পারে, যেমন পাখির গান বা সাইরেন।
  • একক প্রম্পটে অডিও ডেটার সর্বাধিক সমর্থিত দৈর্ঘ্য হল 9.5 ঘন্টা। মিথুন একটি একক প্রম্পটে অডিও ফাইলের সংখ্যা সীমাবদ্ধ করে না; যাইহোক, একটি একক প্রম্পটে সমস্ত অডিও ফাইলের মোট সম্মিলিত দৈর্ঘ্য 9.5 ঘন্টার বেশি হতে পারে না।
  • Gemini অডিও ফাইলগুলিকে 16 Kbps ডেটা রেজোলিউশনে নমুনা দেয়।
  • অডিও উৎসে একাধিক চ্যানেল থাকলে, জেমিনি সেই চ্যানেলগুলিকে একক চ্যানেলে একত্রিত করে।
,

মিথুন অডিও সম্বন্ধে প্রম্পটে সাড়া দিতে পারে। উদাহরণস্বরূপ, মিথুন করতে পারেন:

  • অডিও বিষয়বস্তু সম্পর্কে বর্ণনা, সারসংক্ষেপ বা প্রশ্নের উত্তর দিন।
  • অডিও একটি প্রতিলিপি প্রদান.
  • অডিওর একটি নির্দিষ্ট অংশ সম্পর্কে উত্তর বা ট্রান্সক্রিপশন প্রদান করুন।

এই নির্দেশিকা বিভিন্ন উপায় প্রদর্শন করে:

  • মিথুন মডেলের কাছে অডিও পাঠান।
  • মিথুন মডেলকে অডিও সম্পর্কে অনুরোধ করুন।

সমর্থিত অডিও ফরম্যাট

জেমিনি নিম্নলিখিত অডিও ফর্ম্যাট MIME প্রকারগুলিকে সমর্থন করে:

  • WAV - অডিও/wav
  • MP3 - অডিও/mp3
  • AIFF - অডিও/এআইএফএফ
  • AAC - অডিও/aac
  • OGG Vorbis - অডিও/ogg
  • FLAC - অডিও/flac

অডিও সম্পর্কে প্রযুক্তিগত বিবরণ

মিথুন অডিওতে নিম্নলিখিত নিয়মগুলি আরোপ করে:

  • মিথুন অডিওর প্রতিটি সেকেন্ড 25 টোকেন হিসাবে উপস্থাপন করে; উদাহরণস্বরূপ, এক মিনিটের অডিওকে 1,500 টোকেন হিসাবে উপস্থাপন করা হয়।
  • মিথুন শুধুমাত্র ইংরেজি ভাষার বক্তৃতার প্রতিক্রিয়া অনুমান করতে পারে।
  • মিথুন অ-বক্তৃতা উপাদান "বুঝতে" পারে, যেমন পাখির গান বা সাইরেন।
  • একক প্রম্পটে অডিও ডেটার সর্বাধিক সমর্থিত দৈর্ঘ্য হল 9.5 ঘন্টা। মিথুন একটি একক প্রম্পটে অডিও ফাইলের সংখ্যা সীমাবদ্ধ করে না; যাইহোক, একটি একক প্রম্পটে সমস্ত অডিও ফাইলের মোট সম্মিলিত দৈর্ঘ্য 9.5 ঘন্টার বেশি হতে পারে না।
  • Gemini অডিও ফাইলগুলিকে 16 Kbps ডেটা রেজোলিউশনে নমুনা দেয়।
  • অডিও উৎসে একাধিক চ্যানেল থাকলে, জেমিনি সেই চ্যানেলগুলিকে একক চ্যানেলে একত্রিত করে।