মিথুন মডেল

মডেল বৈকল্পিক

Gemini API বিভিন্ন মডেল অফার করে যা নির্দিষ্ট ব্যবহারের ক্ষেত্রে অপ্টিমাইজ করা হয়। এখানে মিথুন ভেরিয়েন্টগুলির একটি সংক্ষিপ্ত বিবরণ রয়েছে যা উপলব্ধ:

মডেল বৈকল্পিক ইনপুট(গুলি) আউটপুট জন্য অপ্টিমাইজ করা হয়েছে
Gemini 2.0 Flash
gemini-2.0-flash-exp
অডিও, ছবি, ভিডিও এবং পাঠ্য পাঠ্য, ছবি (শীঘ্রই আসছে), এবং অডিও (শীঘ্রই আসছে) বিভিন্ন ধরণের কাজের জন্য পরবর্তী প্রজন্মের বৈশিষ্ট্য, গতি এবং মাল্টিমোডাল প্রজন্ম
মিথুন 1.5 ফ্ল্যাশ
gemini-1.5-flash
অডিও, ছবি, ভিডিও এবং পাঠ্য পাঠ্য বিভিন্ন ধরনের কাজ জুড়ে দ্রুত এবং বহুমুখী কর্মক্ষমতা
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
অডিও, ছবি, ভিডিও এবং পাঠ্য পাঠ্য উচ্চ ভলিউম এবং কম বুদ্ধিমত্তা কাজ
মিথুন 1.5 প্রো
gemini-1.5-pro
অডিও, ছবি, ভিডিও এবং পাঠ্য পাঠ্য জটিল যুক্তিযুক্ত কাজগুলির জন্য আরও বুদ্ধিমত্তা প্রয়োজন
(2/15/2025 তারিখে বন্ধ করা হয়েছে) Gemini 1.0 Pro
gemini-1.0-pro
পাঠ্য পাঠ্য প্রাকৃতিক ভাষার কাজ, মাল্টি-টার্ন টেক্সট এবং কোড চ্যাট এবং কোড জেনারেশন
পাঠ্য এমবেডিং
text-embedding-004
পাঠ্য টেক্সট এম্বেডিং টেক্সট স্ট্রিং এর সংশ্লিষ্টতা পরিমাপ
AQA
aqa
পাঠ্য পাঠ্য প্রশ্নের উৎস-ভিত্তিক উত্তর প্রদান করা

(পরীক্ষামূলক) Gemini 2.0 Flash

জেমিনি 2.0 ফ্ল্যাশ পরবর্তী প্রজন্মের বৈশিষ্ট্য এবং উন্নত ক্ষমতা প্রদান করে, যার মধ্যে রয়েছে উচ্চতর গতি, নেটিভ টুল ব্যবহার, মাল্টিমোডাল জেনারেশন এবং একটি 1M টোকেন প্রসঙ্গ উইন্ডো। আমাদের ওভারভিউ পৃষ্ঠায় জেমিনি 2.0 ফ্ল্যাশ সম্পর্কে আরও জানুন।

Google AI স্টুডিওতে চেষ্টা করুন

মডেলের বিবরণ

সম্পত্তি বর্ণনা
মডেল কোড models/gemini-2.0-flash-exp
সমর্থিত ডেটা প্রকার

ইনপুট

অডিও, ছবি, ভিডিও এবং পাঠ্য

আউটপুট

অডিও (শীঘ্রই আসছে), ছবি (শীঘ্রই আসছে), এবং পাঠ্য

টোকেন সীমা [*]

ইনপুট টোকেন সীমা

1,048,576

আউটপুট টোকেন সীমা

8,192

হারের সীমা [**]
  • 10 RPM
  • 4 মিলিয়ন টিপিএম
  • 1,500 RPD
ক্ষমতা

স্ট্রাকচার্ড আউটপুট

সমর্থিত

ক্যাশিং

সমর্থিত নয়

টিউনিং

সমর্থিত নয়

ফাংশন কলিং

সমর্থিত

কোড এক্সিকিউশন

সমর্থিত

অনুসন্ধান করুন

সমর্থিত

ইমেজ প্রজন্ম

সমর্থিত

নেটিভ টুল ব্যবহার

সমর্থিত

অডিও প্রজন্ম

সমর্থিত

সংস্করণ
আরো বিস্তারিত জানার জন্য মডেল সংস্করণ নিদর্শন পড়ুন.
  • সর্বশেষ: gemini-2.0-flash-exp
সর্বশেষ আপডেট ডিসেম্বর 2024

মিথুন 1.5 ফ্ল্যাশ

জেমিনি 1.5 ফ্ল্যাশ হল একটি দ্রুত এবং বহুমুখী মাল্টিমডাল মডেল যা বিভিন্ন কাজ জুড়ে স্কেলিং করার জন্য।

Google AI স্টুডিওতে চেষ্টা করুন

মডেলের বিবরণ

সম্পত্তি বর্ণনা
মডেল কোড models/gemini-1.5-flash
সমর্থিত ডেটা প্রকার

ইনপুট

অডিও, ছবি, ভিডিও এবং পাঠ্য

আউটপুট

পাঠ্য

টোকেন সীমা [*]

ইনপুট টোকেন সীমা

1,048,576

আউটপুট টোকেন সীমা

8,192

অডিও/ভিজ্যুয়াল স্পেস

প্রতি প্রম্পটে সর্বাধিক সংখ্যক ছবি

৩,৬০০

ভিডিওর সর্বোচ্চ দৈর্ঘ্য

1 ঘন্টা

সর্বাধিক অডিও দৈর্ঘ্য

প্রায় 9.5 ঘন্টা

হারের সীমা [**]
বিনামূল্যে:
  • 15 RPM
  • 1 মিলিয়ন টিপিএম
  • 1,500 RPD
যেভাবে-যেমন-প্রদান করুন:
  • 2,000 আরপিএম
  • 4 মিলিয়ন টিপিএম
ক্ষমতা

সিস্টেম নির্দেশাবলী

সমর্থিত

JSON মোড

সমর্থিত

JSON স্কিমা

সমর্থিত

সামঞ্জস্যযোগ্য নিরাপত্তা সেটিংস

সমর্থিত

ক্যাশিং

সমর্থিত

টিউনিং

সমর্থিত

ফাংশন কলিং

সমর্থিত

কোড এক্সিকিউশন

সমর্থিত

দ্বিমুখী স্ট্রিমিং

সমর্থিত নয়

সংস্করণ
আরো বিস্তারিত জানার জন্য মডেল সংস্করণ নিদর্শন পড়ুন.
  • সর্বশেষ: gemini-1.5-flash-latest
  • সর্বশেষ স্থিতিশীল: gemini-1.5-flash
  • স্থিতিশীল:
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
সর্বশেষ আপডেট সেপ্টেম্বর 2024

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B হল একটি ছোট মডেল যা নিম্ন বুদ্ধিমত্তার কাজের জন্য ডিজাইন করা হয়েছে।

Google AI স্টুডিওতে চেষ্টা করুন

মডেলের বিবরণ

সম্পত্তি বর্ণনা
মডেল কোড models/gemini-1.5-flash-8b
সমর্থিত ডেটা প্রকার

ইনপুট

অডিও, ছবি, ভিডিও এবং পাঠ্য

আউটপুট

পাঠ্য

টোকেন সীমা [*]

ইনপুট টোকেন সীমা

1,048,576

আউটপুট টোকেন সীমা

8,192

অডিও/ভিজ্যুয়াল স্পেস

প্রতি প্রম্পটে সর্বাধিক সংখ্যক ছবি

৩,৬০০

ভিডিওর সর্বোচ্চ দৈর্ঘ্য

1 ঘন্টা

সর্বাধিক অডিও দৈর্ঘ্য

প্রায় 9.5 ঘন্টা

হারের সীমা [**]
বিনামূল্যে:
  • 15 RPM
  • 1 মিলিয়ন টিপিএম
  • 1,500 RPD
যেভাবে-যেমন-প্রদান করুন:
  • 4,000 RPM
  • 4 মিলিয়ন টিপিএম
ক্ষমতা

সিস্টেম নির্দেশাবলী

সমর্থিত

JSON মোড

সমর্থিত

JSON স্কিমা

সমর্থিত

সামঞ্জস্যযোগ্য নিরাপত্তা সেটিংস

সমর্থিত

ক্যাশিং

সমর্থিত

টিউনিং

সমর্থিত

ফাংশন কলিং

সমর্থিত

কোড এক্সিকিউশন

সমর্থিত

দ্বিমুখী স্ট্রিমিং

সমর্থিত নয়

সংস্করণ
আরো বিস্তারিত জানার জন্য মডেল সংস্করণ নিদর্শন পড়ুন.
  • সর্বশেষ: gemini-1.5-flash-8b-latest
  • সর্বশেষ স্থিতিশীল: gemini-1.5-flash-8b
  • স্থিতিশীল:
    • gemini-1.5-flash-8b-001
সর্বশেষ আপডেট অক্টোবর 2024

মিথুন 1.5 প্রো

Gemini 1.5 Pro হল একটি মধ্য-আকারের মাল্টিমোডাল মডেল যা বিস্তৃত পরিসরের যুক্তিমূলক কাজের জন্য অপ্টিমাইজ করা হয়েছে। 1.5 Pro একসাথে 2 ঘন্টা ভিডিও, 19 ঘন্টার অডিও, কোডের 60,000 লাইনের কোডবেস বা 2,000 পৃষ্ঠার পাঠ্য সহ প্রচুর পরিমাণে ডেটা প্রক্রিয়া করতে পারে।

Google AI স্টুডিওতে চেষ্টা করুন

মডেলের বিবরণ

সম্পত্তি বর্ণনা
মডেল কোড models/gemini-1.5-pro
সমর্থিত ডেটা প্রকার

ইনপুট

অডিও, ছবি, ভিডিও এবং পাঠ্য

আউটপুট

পাঠ্য

টোকেন সীমা [*]

ইনপুট টোকেন সীমা

2,097,152

আউটপুট টোকেন সীমা

8,192

অডিও/ভিজ্যুয়াল স্পেস

প্রতি প্রম্পটে সর্বাধিক সংখ্যক ছবি

7,200

ভিডিওর সর্বোচ্চ দৈর্ঘ্য

2 ঘন্টা

সর্বাধিক অডিও দৈর্ঘ্য

প্রায় 19 ঘন্টা

হারের সীমা [**]
বিনামূল্যে:
  • 2 RPM
  • 32,000 টিপিএম
  • 50 RPD
পে-হিসাবে আপনি যান:
  • 1,000 RPM
  • 4 মিলিয়ন টিপিএম
ক্ষমতা

সিস্টেম নির্দেশাবলী

সমর্থিত

JSON মোড

সমর্থিত

JSON স্কিমা

সমর্থিত

সামঞ্জস্যযোগ্য নিরাপত্তা সেটিংস

সমর্থিত

ক্যাশিং

সমর্থিত

টিউনিং

সমর্থিত নয়

ফাংশন কলিং

সমর্থিত

কোড এক্সিকিউশন

সমর্থিত

দ্বিমুখী স্ট্রিমিং

সমর্থিত নয়

সংস্করণ
আরো বিস্তারিত জানার জন্য মডেল সংস্করণ নিদর্শন পড়ুন.
  • সর্বশেষ: gemini-1.5-pro-latest
  • সর্বশেষ স্থিতিশীল: gemini-1.5-pro
  • স্থিতিশীল:
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
সর্বশেষ আপডেট সেপ্টেম্বর 2024

(বঞ্চিত) Gemini 1.0 Pro

Gemini 1.0 Pro হল একটি NLP মডেল যা মাল্টি-টার্ন টেক্সট এবং কোড চ্যাট এবং কোড জেনারেশনের মতো কাজগুলি পরিচালনা করে।

Google AI স্টুডিওতে চেষ্টা করুন

মডেলের বিবরণ

সম্পত্তি বর্ণনা
মডেল কোড models/gemini-1.0-pro
সমর্থিত ডেটা প্রকার

ইনপুট

পাঠ্য

আউটপুট

পাঠ্য

হারের সীমা [**]
বিনামূল্যে:
  • 15 RPM
  • 32,000 টিপিএম
  • 1,500 RPD
যেভাবে-যেমন-প্রদান করুন:
  • 360 RPM
  • 120,000 TPM
  • 30,000 RPD
ক্ষমতা

সিস্টেম নির্দেশাবলী

সমর্থিত নয়

JSON মোড

সমর্থিত নয়

JSON স্কিমা

সমর্থিত নয়

সামঞ্জস্যযোগ্য নিরাপত্তা সেটিংস

সমর্থিত

ক্যাশিং

সমর্থিত নয়

টিউনিং

সমর্থিত

ফাংশন কলিং

সমর্থিত

ফাংশন কলিং কনফিগারেশন

সমর্থিত নয়

কোড এক্সিকিউশন

সমর্থিত নয়

দ্বিমুখী স্ট্রিমিং

সমর্থিত নয়

সংস্করণ
  • সর্বশেষ: gemini-1.0-pro-latest
  • সর্বশেষ স্থিতিশীল: gemini-1.0-pro
  • স্থিতিশীল: gemini-1.0-pro-001
সর্বশেষ আপডেট ফেব্রুয়ারি 2024

টেক্সট এম্বেডিং এবং এমবেডিং

পাঠ্য এমবেডিং

টেক্সট এম্বেডিংগুলি স্ট্রিংগুলির সম্পর্কিততা পরিমাপ করতে ব্যবহৃত হয় এবং অনেক এআই অ্যাপ্লিকেশনগুলিতে ব্যাপকভাবে ব্যবহৃত হয়।

text-embedding-004 একটি শক্তিশালী পুনরুদ্ধার কার্যক্ষমতা অর্জন করে এবং মান MTEB এম্বেডিং বেঞ্চমার্কে তুলনামূলক মাত্রা সহ বিদ্যমান মডেলগুলিকে ছাড়িয়ে যায়

মডেলের বিবরণ
সম্পত্তি বর্ণনা
মডেল কোড

জেমিনি API

models/text-embedding-004

সমর্থিত ডেটা প্রকার

ইনপুট

পাঠ্য

আউটপুট

টেক্সট এম্বেডিং

টোকেন সীমা [*]

ইনপুট টোকেন সীমা

2,048

আউটপুট মাত্রা আকার

768

হারের সীমা [**] প্রতি মিনিটে 1,500টি অনুরোধ
সামঞ্জস্যযোগ্য নিরাপত্তা সেটিংস সমর্থিত নয়
সর্বশেষ আপডেট এপ্রিল 2024

এমবেডিং

আপনি ইনপুট পাঠ্যের জন্য টেক্সট এম্বেডিং তৈরি করতে এমবেডিং মডেল ব্যবহার করতে পারেন।

এমবেডিং মডেলটি 2,048 টোকেন পর্যন্ত পাঠ্যের জন্য 768 মাত্রা সহ এমবেডিং তৈরি করার জন্য অপ্টিমাইজ করা হয়েছে।

মডেল বিশদ এম্বেডিং
সম্পত্তি বর্ণনা
মডেল কোড models/embedding-001
সমর্থিত ডেটা প্রকার

ইনপুট

পাঠ্য

আউটপুট

টেক্সট এম্বেডিং

টোকেন সীমা [*]

ইনপুট টোকেন সীমা

2,048

আউটপুট মাত্রা আকার

768

হারের সীমা [**] প্রতি মিনিটে 1,500টি অনুরোধ
সামঞ্জস্যযোগ্য নিরাপত্তা সেটিংস সমর্থিত নয়
সর্বশেষ আপডেট ডিসেম্বর 2023

AQA

আপনি AQA মডেল ব্যবহার করতে পারেন অ্যাট্রিবিউটেড প্রশ্ন-উত্তর প্রদান (AQA)-এর সাথে সম্পর্কিত কাজগুলি একটি নথি, কর্পাস বা প্যাসেজের একটি সেটে। AQA মডেল প্রশ্নগুলির উত্তর দেয় যেগুলি প্রদত্ত উত্সগুলিতে ভিত্তি করে, উত্তরযোগ্য সম্ভাব্যতার অনুমান সহ।

মডেলের বিবরণ

সম্পত্তি বর্ণনা
মডেল কোড models/aqa
সমর্থিত ডেটা প্রকার

ইনপুট

পাঠ্য

আউটপুট

পাঠ্য

সমর্থিত ভাষা ইংরেজি
টোকেন সীমা [*]

ইনপুট টোকেন সীমা

7,168

আউটপুট টোকেন সীমা

1,024

হারের সীমা [**] প্রতি মিনিটে 1,500টি অনুরোধ
সামঞ্জস্যযোগ্য নিরাপত্তা সেটিংস সমর্থিত
সর্বশেষ আপডেট ডিসেম্বর 2023

এই মডেল বৈচিত্রগুলির ক্ষমতাগুলি অন্বেষণ করতে উদাহরণগুলি দেখুন৷

[*] মিথুন মডেলের জন্য একটি টোকেন প্রায় 4টি অক্ষরের সমতুল্য। 100 টোকেন প্রায় 60-80 ইংরেজি শব্দ।

[**] RPM: প্রতি মিনিটে অনুরোধ
TPM: প্রতি মিনিটে টোকেন
RPD: প্রতিদিনের অনুরোধ
TPD: প্রতিদিন টোকেন

ক্ষমতার সীমাবদ্ধতার কারণে, নির্দিষ্ট সর্বোচ্চ হারের সীমা নিশ্চিত করা হয় না।

মডেল সংস্করণ নামের নিদর্শন

মিথুন মডেলগুলি পূর্বরূপ বা স্থিতিশীল সংস্করণে উপলব্ধ। আপনার কোডে, আপনি কোন মডেল এবং সংস্করণটি ব্যবহার করতে চান তা নির্দিষ্ট করতে আপনি নিম্নলিখিত মডেল নামের ফর্ম্যাটগুলির মধ্যে একটি ব্যবহার করতে পারেন৷

  • সর্বশেষ: একটি নির্দিষ্ট প্রজন্ম এবং প্রকরণের জন্য মডেলের অত্যাধুনিক সংস্করণের দিকে নির্দেশ করে৷ অন্তর্নিহিত মডেল নিয়মিত আপডেট করা হয় এবং একটি পূর্বরূপ সংস্করণ হতে পারে. শুধুমাত্র অনুসন্ধানমূলক পরীক্ষামূলক অ্যাপ এবং প্রোটোটাইপ এই উপনাম ব্যবহার করা উচিত।

    সর্বশেষ সংস্করণ নির্দিষ্ট করতে, নিম্নলিখিত প্যাটার্নটি ব্যবহার করুন: <model>-<generation>-<variation>-latest । উদাহরণস্বরূপ, gemini-1.0-pro-latest

  • সর্বশেষ স্থিতিশীল: নির্দিষ্ট মডেল জেনারেশন এবং প্রকরণের জন্য প্রকাশিত সবচেয়ে সাম্প্রতিক স্থিতিশীল সংস্করণের দিকে নির্দেশ করে।

    সর্বশেষ স্থিতিশীল সংস্করণ নির্দিষ্ট করতে, নিম্নলিখিত প্যাটার্নটি ব্যবহার করুন: <model>-<generation>-<variation> । উদাহরণস্বরূপ, gemini-1.0-pro

  • স্থিতিশীল: একটি নির্দিষ্ট স্থিতিশীল মডেলের দিকে নির্দেশ করে। স্থিতিশীল মডেল পরিবর্তন হয় না. বেশিরভাগ উৎপাদন অ্যাপের একটি নির্দিষ্ট স্থিতিশীল মডেল ব্যবহার করা উচিত।

    একটি স্থিতিশীল সংস্করণ নির্দিষ্ট করতে, নিম্নলিখিত প্যাটার্নটি ব্যবহার করুন: <model>-<generation>-<variation>-<version> । উদাহরণস্বরূপ, gemini-1.0-pro-001

  • পরীক্ষামূলক: শর্তাবলীতে সংজ্ঞায়িত হিসাবে প্রিভিউতে উপলব্ধ একটি পরীক্ষামূলক মডেলের দিকে নির্দেশ করে, যার অর্থ এটি উৎপাদন ব্যবহারের জন্য নয়। আমরা প্রতিক্রিয়া সংগ্রহ করতে, আমাদের সাম্প্রতিক আপডেটগুলি দ্রুত বিকাশকারীদের হাতে পেতে এবং Google-এ ঘটছে উদ্ভাবনের গতি হাইলাইট করতে পরীক্ষামূলক মডেলগুলি প্রকাশ করি৷ পরীক্ষামূলক লঞ্চগুলি থেকে আমরা যা শিখি তা জানায় যে আমরা কীভাবে আরও ব্যাপকভাবে মডেলগুলি প্রকাশ করি। একটি পরীক্ষামূলক মডেল পূর্ব বিজ্ঞপ্তি ছাড়াই অন্যটির জন্য অদলবদল করা যেতে পারে। আমরা গ্যারান্টি দিই না যে একটি পরীক্ষামূলক মডেল ভবিষ্যতে একটি স্থিতিশীল মডেল হয়ে উঠবে।

    একটি পরীক্ষামূলক সংস্করণ নির্দিষ্ট করতে, নিম্নলিখিত প্যাটার্ন ব্যবহার করুন: <model>-<generation>-<variation>-<version> । উদাহরণস্বরূপ, gemini-exp-1121

উপলব্ধ ভাষা

মিথুন মডেলদের নিম্নলিখিত ভাষাগুলির সাথে কাজ করার জন্য প্রশিক্ষণ দেওয়া হয়:

  • আরবি ( ar )
  • বাংলা ( bn )
  • বুলগেরিয়ান ( bg )
  • চীনা সরলীকৃত এবং ঐতিহ্যগত ( zh )
  • ক্রোয়েশিয়ান ( hr )
  • চেক ( cs )
  • ডেনিশ ( da )
  • ডাচ ( nl )
  • ইংরেজি ( en )
  • এস্তোনিয়ান ( et )
  • ফিনিশ ( fi )
  • ফরাসি ( fr )
  • জার্মান ( de )
  • গ্রীক ( el )
  • হিব্রু ( iw )
  • হিন্দি ( hi )
  • হাঙ্গেরিয়ান ( hu )
  • ইন্দোনেশিয়ান ( id )
  • Italian ( it )
  • জাপানি ( ja )
  • কোরিয়ান ( ko )
  • লাটভিয়ান ( lv )
  • লিথুয়ানিয়ান ( lt )
  • নরওয়েজিয়ান ( no )
  • পোলিশ ( pl )
  • পর্তুগিজ ( pt )
  • রোমানিয়ান ( ro )
  • রাশিয়ান ( ru )
  • সার্বিয়ান ( sr )
  • স্লোভাক ( sk )
  • স্লোভেনীয় ( sl )
  • স্প্যানিশ ( es )
  • সোয়াহিলি ( sw )
  • সুইডিশ ( sv )
  • থাই ( th )
  • তুর্কি ( tr )
  • ইউক্রেনীয় ( uk )
  • ভিয়েতনামী ( vi )