Gemini

মডেল বৈকল্পিক

Gemini API বিভিন্ন মডেল অফার করে যা নির্দিষ্ট ব্যবহারের ক্ষেত্রে অপ্টিমাইজ করা হয়। এখানে মিথুন ভেরিয়েন্টগুলির একটি সংক্ষিপ্ত বিবরণ রয়েছে যা উপলব্ধ:

মডেল বৈকল্পিক ইনপুট(গুলি) আউটপুট জন্য অপ্টিমাইজ করা হয়েছে
মিথুন 1.5 প্রো
gemini-1.5-pro
অডিও, ছবি, ভিডিও এবং পাঠ্য পাঠ্য জটিল যুক্তির কাজ যেমন কোড এবং টেক্সট জেনারেশন, টেক্সট এডিটিং, সমস্যা সমাধান, ডেটা এক্সট্রাকশন এবং জেনারেশন
মিথুন 1.5 ফ্ল্যাশ
gemini-1.5-flash
অডিও, ছবি, ভিডিও এবং পাঠ্য পাঠ্য বিভিন্ন ধরনের কাজ জুড়ে দ্রুত এবং বহুমুখী কর্মক্ষমতা
জেমিনি 1.0 প্রো
gemini-1.0-pro
পাঠ্য পাঠ্য প্রাকৃতিক ভাষার কাজ, মাল্টি-টার্ন টেক্সট এবং কোড চ্যাট এবং কোড জেনারেশন
(বঞ্চিত) জেমিনি 1.0 প্রো ভিশন
gemini-pro-vision
ছবি, ভিডিও এবং পাঠ্য পাঠ্য ভিজ্যুয়াল-সম্পর্কিত কাজগুলি, যেমন চিত্রের বর্ণনা তৈরি করা বা ছবিতে বস্তু শনাক্ত করা
পাঠ্য এমবেডিং
text-embedding-004
পাঠ্য টেক্সট এম্বেডিং টেক্সট স্ট্রিং এর সংশ্লিষ্টতা পরিমাপ
AQA
aqa
পাঠ্য পাঠ্য প্রশ্নের উৎস-ভিত্তিক উত্তর প্রদান করা

নিম্নলিখিত সারণীতে মিথুন মডেলের বৈশিষ্ট্যগুলি বর্ণনা করা হয়েছে যা সমস্ত মডেলের বৈকল্পিকগুলির জন্য সাধারণ:

বৈশিষ্ট্য বর্ণনা
প্রশিক্ষণ তথ্য মিথুনের জ্ঞান কাটঅফ নভেম্বর 2023৷ সেই সময়ের পরে ঘটনাগুলি সম্পর্কে জ্ঞান সীমিত৷
সমর্থিত ভাষা উপলব্ধ ভাষা দেখুন
কনফিগারযোগ্য মডেল পরামিতি
  • শীর্ষ পি
  • শীর্ষ k
  • তাপমাত্রা
  • ক্রম বন্ধ করুন
  • সর্বোচ্চ আউটপুট দৈর্ঘ্য
  • প্রতিক্রিয়া প্রার্থীদের সংখ্যা

এই প্রতিটি প্যারামিটার সম্পর্কে তথ্যের জন্য জেনারেটিভ মডেল গাইডের মডেল প্যারামিটার বিভাগটি দেখুন।

মিথুন 1.5 ফ্ল্যাশ

জেমিনি 1.5 ফ্ল্যাশ হল একটি দ্রুত এবং বহুমুখী মাল্টিমডাল মডেল যা বিভিন্ন কাজ জুড়ে স্কেলিং করার জন্য।

এআই স্টুডিওতে চেষ্টা করুন

মডেলের বিবরণ

সম্পত্তি বর্ণনা
মডেল কোড models/gemini-1.5-flash
সমর্থিত ডেটা প্রকার

ইনপুট

অডিও, ছবি, ভিডিও এবং পাঠ্য

আউটপুট

পাঠ্য

টোকেন সীমা [*]

ইনপুট টোকেন সীমা

1,048,576

আউটপুট টোকেন সীমা

8,192

অডিও/ভিজ্যুয়াল স্পেস

প্রতি প্রম্পটে সর্বাধিক সংখ্যক ছবি

৩,৬০০

ভিডিওর সর্বোচ্চ দৈর্ঘ্য

1 ঘন্টা

সর্বাধিক অডিও দৈর্ঘ্য

প্রায় 9.5 ঘন্টা

হারের সীমা [**]
বিনামূল্যে:
  • 15 RPM
  • 1 মিলিয়ন টিপিএম
  • 1,500 RPD
যেমনি খরচ তেমনি পরিশোধ:
  • 1,000 RPM
  • 2 মিলিয়ন টিপিএম
ক্ষমতা

সিস্টেম নির্দেশাবলী

সমর্থিত

JSON মোড

সমর্থিত

JSON স্কিমা

সমর্থিত নয়

সামঞ্জস্যযোগ্য নিরাপত্তা সেটিংস

সমর্থিত

ক্যাশিং

সমর্থিত

টিউনিং

সমর্থিত নয়

ফাংশন কলিং

সমর্থিত

ফাংশন কলিং কনফিগারেশন

সমর্থিত

কোড এক্সিকিউশন

সমর্থিত

সর্বশেষ আপডেট মে 2024

মিথুন 1.5 প্রো

Gemini 1.5 Pro হল একটি মধ্য-আকারের মাল্টিমোডাল মডেল যা বিস্তৃত পরিসরের যুক্তিমূলক কাজের জন্য অপ্টিমাইজ করা হয়েছে। 1.5 Pro একসাথে 2 ঘন্টা ভিডিও, 19 ঘন্টার অডিও, কোডের 60,000 লাইনের কোডবেস বা 2,000 পৃষ্ঠার পাঠ্য সহ প্রচুর পরিমাণে ডেটা প্রক্রিয়া করতে পারে।

এআই স্টুডিওতে চেষ্টা করুন

মডেলের বিবরণ

সম্পত্তি বর্ণনা
মডেল কোড models/gemini-1.5-pro
সমর্থিত ডেটা প্রকার

ইনপুট

অডিও, ছবি, ভিডিও এবং পাঠ্য

আউটপুট

পাঠ্য

টোকেন সীমা [*]

ইনপুট টোকেন সীমা

2,097,152

আউটপুট টোকেন সীমা

8,192

অডিও/ভিজ্যুয়াল স্পেস

প্রতি প্রম্পটে সর্বাধিক সংখ্যক ছবি

7,200

ভিডিওর সর্বোচ্চ দৈর্ঘ্য

২ ঘন্টা

সর্বাধিক অডিও দৈর্ঘ্য

প্রায় 19 ঘন্টা

হারের সীমা [**]
বিনামূল্যে:
  • 2 RPM
  • 32,000 টিপিএম
  • 50 RPD
যেমনি খরচ তেমনি পরিশোধ:
  • 360 RPM
  • 2 মিলিয়ন টিপিএম
  • 10,000 RPD
ক্ষমতা

সিস্টেম নির্দেশাবলী

সমর্থিত

JSON মোড

সমর্থিত

JSON স্কিমা

সমর্থিত

সামঞ্জস্যযোগ্য নিরাপত্তা সেটিংস

সমর্থিত

ক্যাশিং

সমর্থিত

টিউনিং

সমর্থিত নয়

ফাংশন কলিং

সমর্থিত

ফাংশন কলিং কনফিগারেশন

সমর্থিত

কোড এক্সিকিউশন

সমর্থিত

সর্বশেষ আপডেট মে 2024

জেমিনি 1.0 প্রো

Gemini 1.0 Pro হল একটি NLP মডেল যা মাল্টি-টার্ন টেক্সট এবং কোড চ্যাট এবং কোড জেনারেশনের মতো কাজগুলি পরিচালনা করে।

এআই স্টুডিওতে চেষ্টা করুন

মডেলের বিবরণ

সম্পত্তি বর্ণনা
মডেল কোড models/gemini-1.0-pro
সমর্থিত ডেটা প্রকার

ইনপুট

পাঠ্য

আউটপুট

পাঠ্য

হারের সীমা [**]
বিনামূল্যে:
  • 15 RPM
  • 32,000 টিপিএম
  • 1,500 RPD
যেমনি খরচ তেমনি পরিশোধ:
  • 360 RPM
  • 120,000 TPM
  • 30,000 RPD
ক্ষমতা

সিস্টেম নির্দেশাবলী

সমর্থিত নয়

JSON মোড

সমর্থিত নয়

JSON স্কিমা

সমর্থিত নয়

সামঞ্জস্যযোগ্য নিরাপত্তা সেটিংস

সমর্থিত

ক্যাশিং

সমর্থিত নয়

টিউনিং

সমর্থিত

ফাংশন কলিং

সমর্থিত

ফাংশন কলিং কনফিগারেশন

সমর্থিত নয়

কোড এক্সিকিউশন

সমর্থিত নয়

সর্বশেষ আপডেট ফেব্রুয়ারি 2024

(বঞ্চিত) জেমিনি 1.0 প্রো ভিশন

জেমিনি 1.0 প্রো ভিশন হল একটি পারফরম্যান্স-অপ্টিমাইজ করা মাল্টিমোডাল মডেল যা ভিজ্যুয়াল-সম্পর্কিত কাজগুলি সম্পাদন করতে পারে। উদাহরণস্বরূপ, 1.0 প্রো ভিশন চিত্রের বর্ণনা তৈরি করতে পারে, চিত্রগুলিতে উপস্থিত বস্তুগুলি সনাক্ত করতে পারে, চিত্রগুলিতে উপস্থিত স্থান বা বস্তু সম্পর্কে তথ্য প্রদান করতে পারে এবং আরও অনেক কিছু।

মডেলের বিবরণ

সম্পত্তি বর্ণনা
মডেল কোড models/gemini-pro-vision
সমর্থিত ডেটা প্রকার

ইনপুট

ছবি, ভিডিও এবং পাঠ্য

আউটপুট

পাঠ্য

টোকেন সীমা [*]

ইনপুট টোকেন সীমা

12,288

আউটপুট টোকেন সীমা

৪,০৯৬

অডিও/ভিজ্যুয়াল স্পেস

ভিডিওর সর্বোচ্চ দৈর্ঘ্য

২ মিনিট

হারের সীমা [**] প্রতি মিনিটে 60টি অনুরোধ
ক্ষমতা

সিস্টেম নির্দেশাবলী

সমর্থিত নয়

JSON মোড

সমর্থিত নয়

JSON স্কিমা

সমর্থিত নয়

সামঞ্জস্যযোগ্য নিরাপত্তা সেটিংস

সমর্থিত

ক্যাশিং

সমর্থিত নয়

টিউনিং

সমর্থিত নয়

ফাংশন কলিং

সমর্থিত

ফাংশন কলিং কনফিগারেশন

সমর্থিত নয়

কোড এক্সিকিউশন

সমর্থিত নয়

সর্বশেষ আপডেট ডিসেম্বর 2023

টেক্সট এম্বেডিং এবং এমবেডিং

পাঠ্য এমবেডিং

ইনপুট টেক্সটের জন্য টেক্সট এমবেডিং তৈরি করতে আপনি টেক্সট এমবেডিং মডেল ব্যবহার করতে পারেন। টেক্সট এমবেডিং মডেল সম্পর্কে আরও তথ্যের জন্য, টেক্সট এম্বেডিং সম্পর্কে Vertex AI ডকুমেন্টেশনের জেনারেটিভ এআই দেখুন।

টেক্সট এমবেডিং মডেলটি 2,048 টোকেন পর্যন্ত টেক্সটের জন্য 768 মাত্রা সহ এমবেডিং তৈরি করার জন্য অপ্টিমাইজ করা হয়েছে। টেক্সট এম্বেডিং 768-এর নিচে ইলাস্টিক এমবেডিং মাপ অফার করে। ছোট আউটপুট ডাইমেনশন তৈরি করতে আপনি ইলাস্টিক এম্বেডিং ব্যবহার করতে পারেন এবং ছোটখাট কর্মক্ষমতা ক্ষতির সাথে কম্পিউটিং এবং স্টোরেজ খরচ সাশ্রয় করতে পারেন।

মডেলের বিবরণ
সম্পত্তি বর্ণনা
মডেল কোড

জেমিনি API

models/text-embedding-004

ভার্টেক্স এআই

text-embedding-preview-0409

সমর্থিত ডেটা প্রকার

ইনপুট

পাঠ্য

আউটপুট

টেক্সট এম্বেডিং

টোকেন সীমা [*]

ইনপুট টোকেন সীমা

2,048

আউটপুট মাত্রা আকার

768

হারের সীমা [**] প্রতি মিনিটে 1,500টি অনুরোধ
সামঞ্জস্যযোগ্য নিরাপত্তা সেটিংস সমর্থিত নয়
সর্বশেষ আপডেট এপ্রিল 2024

এমবেডিং

আপনি ইনপুট পাঠ্যের জন্য টেক্সট এম্বেডিং তৈরি করতে এমবেডিং মডেল ব্যবহার করতে পারেন।

এমবেডিং মডেলটি 2,048 টোকেন পর্যন্ত পাঠ্যের জন্য 768 মাত্রা সহ এমবেডিং তৈরি করার জন্য অপ্টিমাইজ করা হয়েছে।

মডেল বিশদ এম্বেডিং
সম্পত্তি বর্ণনা
মডেল কোড models/embedding-001
সমর্থিত ডেটা প্রকার

ইনপুট

পাঠ্য

আউটপুট

টেক্সট এম্বেডিং

টোকেন সীমা [*]

ইনপুট টোকেন সীমা

2,048

আউটপুট মাত্রা আকার

768

হারের সীমা [**] প্রতি মিনিটে 1,500টি অনুরোধ
সামঞ্জস্যযোগ্য নিরাপত্তা সেটিংস সমর্থিত নয়
সর্বশেষ আপডেট ডিসেম্বর 2023

AQA

আপনি AQA মডেল ব্যবহার করতে পারেন অ্যাট্রিবিউটেড প্রশ্ন-উত্তর প্রদান (AQA)-এর সাথে সম্পর্কিত কাজগুলি একটি নথি, কর্পাস বা প্যাসেজের একটি সেটে। AQA মডেল প্রশ্নগুলির উত্তর দেয় যেগুলি প্রদত্ত উত্সগুলিতে ভিত্তি করে, উত্তরযোগ্য সম্ভাব্যতার অনুমান সহ।

মডেলের বিবরণ

সম্পত্তি বর্ণনা
মডেল কোড models/aqa
সমর্থিত ডেটা প্রকার

ইনপুট

পাঠ্য

আউটপুট

পাঠ্য

সমর্থিত ভাষা ইংরেজি
টোকেন সীমা [*]

ইনপুট টোকেন সীমা

7,168

আউটপুট টোকেন সীমা

1,024

হারের সীমা [**] প্রতি মিনিটে 1,500টি অনুরোধ
সামঞ্জস্যযোগ্য নিরাপত্তা সেটিংস সমর্থিত
সর্বশেষ আপডেট ডিসেম্বর 2023

এই মডেল বৈচিত্রগুলির ক্ষমতাগুলি অন্বেষণ করতে উদাহরণগুলি দেখুন৷

[*] মিথুন মডেলের জন্য একটি টোকেন প্রায় 4টি অক্ষরের সমতুল্য। 100 টোকেন প্রায় 60-80 ইংরেজি শব্দ।

[**] RPM: প্রতি মিনিটে অনুরোধ
TPM: প্রতি মিনিটে টোকেন
RPD: প্রতিদিনের অনুরোধ
TPD: প্রতিদিন টোকেন

ক্ষমতার সীমাবদ্ধতার কারণে, নির্দিষ্ট সর্বোচ্চ হারের সীমা নিশ্চিত করা হয় না।

মডেল সংস্করণ নামের নিদর্শন

মিথুন মডেলগুলি পূর্বরূপ বা স্থিতিশীল সংস্করণে উপলব্ধ। আপনার কোডে, আপনি কোন মডেল এবং সংস্করণটি ব্যবহার করতে চান তা নির্দিষ্ট করতে আপনি নিম্নলিখিত মডেল নামের ফর্ম্যাটগুলির মধ্যে একটি ব্যবহার করতে পারেন৷

  • সর্বশেষ: একটি নির্দিষ্ট প্রজন্ম এবং প্রকরণের জন্য মডেলের অত্যাধুনিক সংস্করণের দিকে নির্দেশ করে৷ অন্তর্নিহিত মডেল নিয়মিত আপডেট করা হয় এবং একটি পূর্বরূপ সংস্করণ হতে পারে. শুধুমাত্র অনুসন্ধানমূলক পরীক্ষামূলক অ্যাপ এবং প্রোটোটাইপ এই উপনাম ব্যবহার করা উচিত।

    সর্বশেষ সংস্করণ নির্দিষ্ট করতে, নিম্নলিখিত প্যাটার্নটি ব্যবহার করুন: <model>-<generation>-<variation>-latest । উদাহরণস্বরূপ, gemini-1.0-pro-latest

  • সর্বশেষ স্থিতিশীল: নির্দিষ্ট মডেল জেনারেশন এবং প্রকরণের জন্য প্রকাশিত সবচেয়ে সাম্প্রতিক স্থিতিশীল সংস্করণের দিকে নির্দেশ করে।

    সর্বশেষ স্থিতিশীল সংস্করণ নির্দিষ্ট করতে, নিম্নলিখিত প্যাটার্নটি ব্যবহার করুন: <model>-<generation>-<variation> । উদাহরণস্বরূপ, gemini-1.0-pro

  • স্থিতিশীল: একটি নির্দিষ্ট স্থিতিশীল মডেলের দিকে নির্দেশ করে। স্থিতিশীল মডেল পরিবর্তন হয় না. বেশিরভাগ উৎপাদন অ্যাপের একটি নির্দিষ্ট স্থিতিশীল মডেল ব্যবহার করা উচিত।

    একটি স্থিতিশীল সংস্করণ নির্দিষ্ট করতে, নিম্নলিখিত প্যাটার্নটি ব্যবহার করুন: <model>-<generation>-<variation>-<version> । উদাহরণস্বরূপ, gemini-1.0-pro-001

উপলব্ধ ভাষা

মিথুন মডেলদের নিম্নলিখিত ভাষাগুলির সাথে কাজ করার জন্য প্রশিক্ষণ দেওয়া হয়:

  • আরবি ( ar )
  • বাংলা ( bn )
  • বুলগেরিয়ান ( bg )
  • চীনা সরলীকৃত এবং ঐতিহ্যগত ( zh )
  • ক্রোয়েশিয়ান ( hr )
  • চেক ( cs )
  • ডেনিশ ( da )
  • ডাচ ( nl )
  • ইংরেজি ( en )
  • এস্তোনিয়ান ( et )
  • ফিনিশ ( fi )
  • ফরাসি ( fr )
  • জার্মান ( de )
  • গ্রীক ( el )
  • হিব্রু ( iw )
  • হিন্দি ( hi )
  • হাঙ্গেরিয়ান ( hu )
  • ইন্দোনেশিয়ান ( id )
  • ইতালীয় ( it )
  • জাপানি ( ja )
  • কোরিয়ান ( ko )
  • লাটভিয়ান ( lv )
  • লিথুয়ানিয়ান ( lt )
  • নরওয়েজিয়ান ( no )
  • পোলিশ ( pl )
  • পর্তুগিজ ( pt )
  • রোমানিয়ান ( ro )
  • রাশিয়ান ( ru )
  • সার্বিয়ান ( sr )
  • স্লোভাক ( sk )
  • স্লোভেনীয় ( sl )
  • স্প্যানিশ ( es )
  • সোয়াহিলি ( sw )
  • সুইডিশ ( sv )
  • থাই ( th )
  • তুর্কি ( tr )
  • ইউক্রেনীয় ( uk )
  • ভিয়েতনামী ( vi )