জেমিনি হল জেনারেটিভ এআই মডেলের একটি পরিবার যা ডেভেলপারদের বিষয়বস্তু তৈরি করতে এবং সমস্যার সমাধান করতে দেয়। এই মডেলগুলি ইনপুট হিসাবে পাঠ্য এবং চিত্র উভয়ই পরিচালনা করার জন্য ডিজাইন এবং প্রশিক্ষিত। এই নির্দেশিকাটি আপনার ব্যবহারের ক্ষেত্রে কোনটি সবচেয়ে উপযুক্ত তা নির্ধারণ করতে আপনাকে সাহায্য করার জন্য প্রতিটি মডেলের বৈকল্পিক সম্পর্কে তথ্য প্রদান করে।
মডেল বৈকল্পিক
Gemini API বিভিন্ন মডেল অফার করে যা নির্দিষ্ট ব্যবহারের ক্ষেত্রে অপ্টিমাইজ করা হয়। এখানে মিথুন ভেরিয়েন্টগুলির একটি সংক্ষিপ্ত বিবরণ রয়েছে যা উপলব্ধ:
মডেল বৈকল্পিক | ইনপুট(গুলি) | আউটপুট | জন্য অপ্টিমাইজ করা হয়েছে |
---|---|---|---|
মিথুন 1.5 প্রোgemini-1.5-pro | অডিও, ছবি, ভিডিও এবং পাঠ্য | পাঠ্য | জটিল যুক্তির কাজ যেমন কোড এবং টেক্সট জেনারেশন, টেক্সট এডিটিং, সমস্যা সমাধান, ডেটা এক্সট্রাকশন এবং জেনারেশন |
মিথুন 1.5 ফ্ল্যাশgemini-1.5-flash | অডিও, ছবি, ভিডিও এবং পাঠ্য | পাঠ্য | বিভিন্ন ধরনের কাজ জুড়ে দ্রুত এবং বহুমুখী কর্মক্ষমতা |
জেমিনি 1.0 প্রোgemini-1.0-pro | পাঠ্য | পাঠ্য | প্রাকৃতিক ভাষার কাজ, মাল্টি-টার্ন টেক্সট এবং কোড চ্যাট এবং কোড জেনারেশন |
(বঞ্চিত) জেমিনি 1.0 প্রো ভিশনgemini-pro-vision | ছবি, ভিডিও এবং পাঠ্য | পাঠ্য | ভিজ্যুয়াল-সম্পর্কিত কাজগুলি, যেমন চিত্রের বর্ণনা তৈরি করা বা ছবিতে বস্তু শনাক্ত করা |
পাঠ্য এমবেডিংtext-embedding-004 | পাঠ্য | টেক্সট এম্বেডিং | টেক্সট স্ট্রিং এর সংশ্লিষ্টতা পরিমাপ |
নিম্নলিখিত সারণীতে মিথুন মডেলের বৈশিষ্ট্যগুলি বর্ণনা করা হয়েছে যা সমস্ত মডেলের রূপের জন্য সাধারণ:
বৈশিষ্ট্য | বর্ণনা |
---|---|
প্রশিক্ষণ তথ্য | মিথুনের জ্ঞান কাটঅফ নভেম্বর 2023৷ সেই সময়ের পরে ঘটনাগুলি সম্পর্কে জ্ঞান সীমিত৷ |
সমর্থিত ভাষা | উপলব্ধ ভাষা দেখুন |
কনফিগারযোগ্য মডেল পরামিতি |
|
এই প্রতিটি প্যারামিটার সম্পর্কে তথ্যের জন্য জেনারেটিভ মডেল গাইডের মডেল প্যারামিটার বিভাগটি দেখুন।
মিথুন 1.5 প্রো
জেমিনি 1.5 প্রো হল একটি মাঝারি আকারের মাল্টিমোডাল মডেল যা বিস্তৃত যুক্তিযুক্ত কাজের জন্য অপ্টিমাইজ করা হয়েছে যেমন:
- কোড প্রজন্ম
- পাঠ্য প্রজন্ম
- পাঠ্য সম্পাদনা
- সমস্যা সমাধান
- সুপারিশ প্রজন্ম
- তথ্য নিষ্কাশন
- তথ্য নিষ্কাশন বা প্রজন্ম
- এআই এজেন্ট তৈরি করা
1.5 Pro একসাথে 1 ঘন্টা ভিডিও, 9.5 ঘন্টার অডিও, 30,000 লাইনের কোড বা 700,000 শব্দের বেশি কোডবেস সহ প্রচুর পরিমাণে ডেটা প্রক্রিয়া করতে পারে৷
1.5 Pro শূন্য-, এক-, এবং কয়েক-শট শেখার কাজগুলি পরিচালনা করতে সক্ষম।
মডেলের বিবরণ
সম্পত্তি | বর্ণনা |
---|---|
কোড এর নকশা | models/gemini-1.5-pro-latest |
ইনপুট | অডিও, ছবি, ভিডিও এবং পাঠ্য |
আউটপুট | পাঠ্য |
সমর্থিত প্রজন্মের পদ্ধতি | generateContent |
ইনপুট টোকেন সীমা [**] | 1,048,576 |
আউটপুট টোকেন সীমা [**] | 8,192 |
প্রতি প্রম্পটে সর্বাধিক সংখ্যক ছবি | ৩,৬০০ |
ভিডিওর সর্বোচ্চ দৈর্ঘ্য | 1 ঘন্টা |
সর্বাধিক অডিও দৈর্ঘ্য | প্রায় 9.5 ঘন্টা |
প্রতি প্রম্পটে অডিও ফাইলের সর্বোচ্চ সংখ্যা | 1 |
মডেল নিরাপত্তা | স্বয়ংক্রিয়ভাবে প্রয়োগ করা সুরক্ষা সেটিংস যা বিকাশকারীদের দ্বারা সামঞ্জস্যযোগ্য। বিস্তারিত জানার জন্য নিরাপত্তা সেটিংস আমাদের পৃষ্ঠা দেখুন. |
হার সীমা [*] |
|
সিস্টেম নির্দেশাবলী | সমর্থিত |
JSON মোড | সমর্থিত |
সর্বশেষ সংস্করণ | gemini-1.5-pro-latest |
সর্বশেষ স্থিতিশীল সংস্করণ | gemini-1.5-pro |
স্থিতিশীল সংস্করণ | gemini-1.5-pro-001 |
সর্বশেষ আপডেট | মে 2024 |
মিথুন 1.5 ফ্ল্যাশ
জেমিনি 1.5 ফ্ল্যাশ হল একটি দ্রুত এবং বহুমুখী মাল্টিমডাল মডেল যা বিভিন্ন কাজ জুড়ে স্কেলিং করার জন্য।
মডেলের বিবরণ
সম্পত্তি | বর্ণনা |
---|---|
কোড এর নকশা | gemini-1.5-flash-latest |
ইনপুট(গুলি) | অডিও, ছবি, ভিডিও এবং পাঠ্য |
আউটপুট | পাঠ্য |
সমর্থিত প্রজন্মের পদ্ধতি | generateContent |
ইনপুট টোকেন সীমা [**] | 1,048,576 |
আউটপুট টোকেন সীমা [**] | 8,192 |
প্রতি প্রম্পটে সর্বাধিক সংখ্যক ছবি | ৩,৬০০ |
ভিডিওর সর্বোচ্চ দৈর্ঘ্য | 1 ঘন্টা |
সর্বাধিক অডিও দৈর্ঘ্য | প্রায় 9.5 ঘন্টা |
প্রতি প্রম্পটে অডিও ফাইলের সর্বোচ্চ সংখ্যা | 1 |
মডেল নিরাপত্তা | স্বয়ংক্রিয়ভাবে প্রয়োগ করা সুরক্ষা সেটিংস যা বিকাশকারীদের দ্বারা সামঞ্জস্যযোগ্য। বিস্তারিত জানার জন্য নিরাপত্তা সেটিংস আমাদের পৃষ্ঠা দেখুন. |
হার সীমা [*] |
|
সিস্টেম নির্দেশাবলী | সমর্থিত |
JSON মোড | সমর্থিত |
মডেল টিউনিং | শীঘ্রই আসছে |
সর্বশেষ সংস্করণ | gemini-1.5-flash-latest |
সর্বশেষ স্থিতিশীল সংস্করণ | gemini-1.5-flash |
স্থিতিশীল সংস্করণ | gemini-1.5-flash-001 |
সর্বশেষ আপডেট | মে 2024 |
জেমিনি 1.0 প্রো
Gemini 1.0 Pro হল একটি NLP মডেল যা মাল্টি-টার্ন টেক্সট এবং কোড চ্যাট এবং কোড জেনারেশনের মতো কাজগুলি পরিচালনা করে।
1.0 Pro শূন্য-, এক-, এবং কয়েক-শট শেখার কাজগুলি পরিচালনা করতে সক্ষম।
মডেলের বিবরণ
সম্পত্তি | বর্ণনা |
---|---|
কোড এর নকশা | models/gemini-1.0-pro |
ইনপুট | পাঠ্য |
আউটপুট | পাঠ্য |
সমর্থিত প্রজন্মের পদ্ধতি | generate_content generateContent |
হার সীমা [*] |
|
সিস্টেম নির্দেশাবলী | অসমর্থিত |
JSON মোড | অসমর্থিত |
মডেল টিউনিং | সমর্থিত: gemini-1.0-pro-001 |
সর্বশেষ সংস্করণ | gemini-1.0-pro-latest |
সর্বশেষ স্থিতিশীল সংস্করণ | gemini-1.0-pro |
স্থিতিশীল সংস্করণ | gemini-1.0-pro-001 |
সর্বশেষ আপডেট | ফেব্রুয়ারি 2024 |
(বঞ্চিত) জেমিনি 1.0 প্রো ভিশন
জেমিনি 1.0 প্রো ভিশন হল একটি পারফরম্যান্স-অপ্টিমাইজ করা মাল্টিমোডাল মডেল যা ভিজ্যুয়াল-সম্পর্কিত কাজগুলি সম্পাদন করতে পারে। উদাহরণস্বরূপ, 1.0 প্রো ভিশন চিত্রের বর্ণনা তৈরি করতে পারে, চিত্রগুলিতে উপস্থিত বস্তুগুলি সনাক্ত করতে পারে, চিত্রগুলিতে উপস্থিত স্থান বা বস্তু সম্পর্কে তথ্য প্রদান করতে পারে এবং আরও অনেক কিছু।
1.0 প্রো ভিশন শূন্য-, এক- এবং কয়েকটি-শট কাজগুলি পরিচালনা করতে সক্ষম।
মডেলের বিবরণ
সম্পত্তি | বর্ণনা |
---|---|
কোড এর নকশা | models/gemini-pro-vision |
ইনপুট | পাঠ্য, ভিডিও এবং চিত্র |
আউটপুট | পাঠ্য |
সমর্থিত প্রজন্মের পদ্ধতি | generate_content generateContent |
ইনপুট টোকেন সীমা [*] | 12,288 |
আউটপুট টোকেন সীমা [*] | ৪,০৯৬ |
সর্বাধিক ছবির আকার | সীমাহীন |
প্রতি প্রম্পটে সর্বাধিক সংখ্যক ছবি | 16 |
ভিডিওর সর্বোচ্চ দৈর্ঘ্য | ২ মিনিট |
প্রতি প্রম্পটে ভিডিওর সর্বোচ্চ সংখ্যা | 1 |
মডেল নিরাপত্তা | স্বয়ংক্রিয়ভাবে প্রয়োগ করা সুরক্ষা সেটিংস যা বিকাশকারীদের দ্বারা সামঞ্জস্যযোগ্য। বিস্তারিত জানার জন্য নিরাপত্তা সেটিংস আমাদের পৃষ্ঠা দেখুন. |
হারের সীমা [*] | প্রতি মিনিটে 60টি অনুরোধ |
সর্বশেষ সংস্করণ | gemini-1.0-pro-vision-latest |
সর্বশেষ স্থিতিশীল সংস্করণ | gemini-1.0-pro-vision |
সর্বশেষ আপডেট | ডিসেম্বর 2023 |
টেক্সট এম্বেডিং এবং এমবেডিং
পাঠ্য এমবেডিং
ইনপুট টেক্সটের জন্য টেক্সট এমবেডিং তৈরি করতে আপনি টেক্সট এমবেডিং মডেল ব্যবহার করতে পারেন। টেক্সট এমবেডিং মডেল সম্পর্কে আরও তথ্যের জন্য, টেক্সট এম্বেডিং সম্পর্কে Vertex AI ডকুমেন্টেশনের জেনারেটিভ এআই দেখুন।
টেক্সট এমবেডিং মডেলটি 2,048 টোকেন পর্যন্ত টেক্সটের জন্য 768 মাত্রা সহ এমবেডিং তৈরি করার জন্য অপ্টিমাইজ করা হয়েছে। টেক্সট এম্বেডিং 768-এর নিচে ইলাস্টিক এমবেডিং মাপ অফার করে। ছোট আউটপুট ডাইমেনশন তৈরি করতে আপনি ইলাস্টিক এম্বেডিং ব্যবহার করতে পারেন এবং ছোটখাট কর্মক্ষমতা ক্ষতির সাথে কম্পিউটিং এবং স্টোরেজ খরচ সাশ্রয় করতে পারেন।
মডেলের বিবরণ
সম্পত্তি | বর্ণনা |
---|---|
কোড এর নকশা | models/text-embedding-004 ( text-embedding-preview-0409 ভার্টেক্স এআই ) |
ইনপুট | পাঠ্য |
আউটপুট | টেক্সট এম্বেডিং |
ইনপুট টোকেন সীমা | 2,048 |
আউটপুট মাত্রা আকার | 768 |
সমর্থিত প্রজন্মের পদ্ধতি | embed_content embedContent |
মডেল নিরাপত্তা | কোন সামঞ্জস্যযোগ্য নিরাপত্তা সেটিংস. |
হারের সীমা [*] | প্রতি মিনিটে 1,500টি অনুরোধ |
সর্বশেষ আপডেট | এপ্রিল 2024 |
এমবেডিং
আপনি ইনপুট পাঠ্যের জন্য টেক্সট এম্বেডিং তৈরি করতে এমবেডিং মডেল ব্যবহার করতে পারেন।
এমবেডিং মডেলটি 2,048 টোকেন পর্যন্ত পাঠ্যের জন্য 768 মাত্রা সহ এমবেডিং তৈরি করার জন্য অপ্টিমাইজ করা হয়েছে।
মডেল বিশদ এম্বেডিং
সম্পত্তি | বর্ণনা |
---|---|
কোড এর নকশা | models/embedding-001 |
ইনপুট | পাঠ্য |
আউটপুট | টেক্সট এম্বেডিং |
ইনপুট টোকেন সীমা | 2,048 |
আউটপুট মাত্রা আকার | 768 |
সমর্থিত প্রজন্মের পদ্ধতি | embed_content embedContent |
মডেল নিরাপত্তা | কোন সামঞ্জস্যযোগ্য নিরাপত্তা সেটিংস. |
হারের সীমা [*] | প্রতি মিনিটে 1,500টি অনুরোধ |
সর্বশেষ আপডেট | ডিসেম্বর 2023 |
AQA
আপনি AQA মডেল ব্যবহার করতে পারেন অ্যাট্রিবিউটেড প্রশ্ন-উত্তর প্রদান (AQA)-এর সাথে সম্পর্কিত কাজগুলি একটি নথি, কর্পাস বা প্যাসেজের একটি সেটে। AQA মডেল প্রশ্নগুলির উত্তর দেয় যেগুলি প্রদত্ত উত্সগুলিতে ভিত্তি করে, উত্তরযোগ্য সম্ভাব্যতার অনুমান সহ।
মডেলের বিবরণ
সম্পত্তি | বর্ণনা |
---|---|
কোড এর নকশা | models/aqa |
ইনপুট | পাঠ্য |
আউটপুট | পাঠ্য |
সমর্থিত প্রজন্মের পদ্ধতি | GenerateAnswerRequest generateAnswer |
সমর্থিত ভাষা | ইংরেজি |
ইনপুট টোকেন সীমা [**] | 7,168 |
আউটপুট টোকেন সীমা [**] | 1,024 |
মডেল নিরাপত্তা | স্বয়ংক্রিয়ভাবে প্রয়োগ করা সুরক্ষা সেটিংস যা বিকাশকারীদের দ্বারা সামঞ্জস্যযোগ্য। বিস্তারিত জানার জন্য নিরাপত্তা সেটিংস আমাদের পৃষ্ঠা দেখুন. |
হারের সীমা [*] | প্রতি মিনিটে 60টি অনুরোধ |
সর্বশেষ আপডেট | ডিসেম্বর 2023 |
এই মডেল বৈচিত্রগুলির ক্ষমতাগুলি অন্বেষণ করতে উদাহরণগুলি দেখুন৷
[*] মিথুন মডেলের জন্য একটি টোকেন প্রায় 4টি অক্ষরের সমতুল্য। 100 টোকেন প্রায় 60-80 ইংরেজি শব্দ।
[**] RPM: প্রতি মিনিটে অনুরোধ
TPM: প্রতি মিনিটে টোকেন
RPD: প্রতিদিনের অনুরোধ
TPD: প্রতিদিন টোকেন
ক্ষমতার সীমাবদ্ধতার কারণে, নির্দিষ্ট সর্বোচ্চ হারের সীমা নিশ্চিত করা হয় না।
মডেল সংস্করণ নামের নিদর্শন
মিথুন মডেলগুলি পূর্বরূপ বা স্থিতিশীল সংস্করণে উপলব্ধ। আপনার কোডে, আপনি কোন মডেল এবং সংস্করণটি ব্যবহার করতে চান তা নির্দিষ্ট করতে আপনি নিম্নলিখিত মডেল নামের ফর্ম্যাটগুলির মধ্যে একটি ব্যবহার করতে পারেন৷
সর্বশেষ: একটি নির্দিষ্ট প্রজন্ম এবং প্রকরণের জন্য মডেলের অত্যাধুনিক সংস্করণের দিকে নির্দেশ করে৷ অন্তর্নিহিত মডেল নিয়মিত আপডেট করা হয় এবং একটি পূর্বরূপ সংস্করণ হতে পারে. শুধুমাত্র অনুসন্ধানমূলক পরীক্ষামূলক অ্যাপ এবং প্রোটোটাইপ এই উপনাম ব্যবহার করা উচিত।
সর্বশেষ সংস্করণ নির্দিষ্ট করতে, নিম্নলিখিত প্যাটার্নটি ব্যবহার করুন:
<model>-<generation>-<variation>-latest
। উদাহরণস্বরূপ,gemini-1.0-pro-latest
।সর্বশেষ স্থিতিশীল: নির্দিষ্ট মডেল জেনারেশন এবং প্রকরণের জন্য প্রকাশিত সবচেয়ে সাম্প্রতিক স্থিতিশীল সংস্করণের দিকে নির্দেশ করে।
সর্বশেষ স্থিতিশীল সংস্করণ নির্দিষ্ট করতে, নিম্নলিখিত প্যাটার্নটি ব্যবহার করুন:
<model>-<generation>-<variation>
। উদাহরণস্বরূপ,gemini-1.0-pro
।স্থিতিশীল: একটি নির্দিষ্ট স্থিতিশীল মডেলের দিকে নির্দেশ করে। স্থিতিশীল মডেল পরিবর্তন হয় না. বেশিরভাগ উৎপাদন অ্যাপের একটি নির্দিষ্ট স্থিতিশীল মডেল ব্যবহার করা উচিত।
একটি স্থিতিশীল সংস্করণ নির্দিষ্ট করতে, নিম্নলিখিত প্যাটার্নটি ব্যবহার করুন:
<model>-<generation>-<variation>-<version>
। উদাহরণস্বরূপ,gemini-1.0-pro-001
।
উপলব্ধ ভাষা
মিথুন মডেলদের নিম্নলিখিত ভাষাগুলির সাথে কাজ করার জন্য প্রশিক্ষণ দেওয়া হয়:
- আরবি (
ar
) - বাংলা (
bn
) - বুলগেরিয়ান (
bg
) - চীনা সরলীকৃত এবং ঐতিহ্যগত (
zh
) - ক্রোয়েশিয়ান (
hr
) - চেক (
cs
) - ডেনিশ (
da
) - ডাচ (
nl
) - ইংরেজি (
en
), - এস্তোনিয়ান (
et
) - ফিনিশ (
fi
) - ফরাসি (
fr
) - জার্মান (
de
) - গ্রীক (
el
) - হিব্রু (
iw
) - হিন্দি (
hi
) - হাঙ্গেরিয়ান (
hu
) - ইন্দোনেশিয়ান (
id
) - ইতালীয় (
it
) - জাপানি (
ja
) - কোরিয়ান (
ko
) - লাটভিয়ান (
lv
), - লিথুয়ানিয়ান (
lt
) - নরওয়েজিয়ান (
no
) - পোলিশ (
pl
) - পর্তুগিজ (
pt
) - রোমানিয়ান (
ro
) - রাশিয়ান (
ru
) - সার্বিয়ান (
sr
) - স্লোভাক (
sk
) - স্লোভেনীয় (
sl
) - স্প্যানিশ (
es
) - সোয়াহিলি (
sw
) - সুইডিশ (
sv
) - থাই (
th
) - তুর্কি (
tr
) - ইউক্রেনীয় (
uk
) - ভিয়েতনামী (
vi
)