জেমিনি হল জেনারেটিভ এআই মডেলের একটি পরিবার যা ডেভেলপারদের বিষয়বস্তু তৈরি করতে এবং সমস্যার সমাধান করতে দেয়। এই মডেলগুলি ইনপুট হিসাবে পাঠ্য এবং চিত্র উভয়ই পরিচালনা করার জন্য ডিজাইন এবং প্রশিক্ষিত। এই নির্দেশিকাটি আপনার ব্যবহারের ক্ষেত্রে কোনটি সবচেয়ে উপযুক্ত তা নির্ধারণ করতে আপনাকে সাহায্য করার জন্য প্রতিটি মডেলের বৈকল্পিক সম্পর্কে তথ্য প্রদান করে।
নিরাপত্তা এবং উদ্দেশ্যে ব্যবহার
জেনারেটিভ কৃত্রিম বুদ্ধিমত্তা মডেলগুলি শক্তিশালী সরঞ্জাম, কিন্তু তারা তাদের সীমাবদ্ধতা ছাড়া নয়। তাদের বহুমুখিতা এবং প্রযোজ্যতা কখনও কখনও অপ্রত্যাশিত আউটপুটের দিকে নিয়ে যেতে পারে, যেমন আউটপুটগুলি ভুল, পক্ষপাতদুষ্ট বা আপত্তিকর। এই ধরনের আউটপুট থেকে ক্ষতির ঝুঁকি সীমিত করার জন্য পোস্ট-প্রসেসিং, এবং কঠোর ম্যানুয়াল মূল্যায়ন অপরিহার্য। অতিরিক্ত নিরাপদ ব্যবহারের পরামর্শের জন্য নিরাপত্তা নির্দেশিকা দেখুন।
জেমিনি API দ্বারা প্রদত্ত মডেলগুলি বিভিন্ন ধরণের জেনারেটিভ এআই এবং প্রাকৃতিক ভাষা প্রক্রিয়াকরণ (NLP) অ্যাপ্লিকেশনের জন্য ব্যবহার করা যেতে পারে। এই ফাংশনগুলির ব্যবহার শুধুমাত্র Gemini API বা Google AI Studio ওয়েব অ্যাপের মাধ্যমে উপলব্ধ। আপনার জেমিনি API-এর ব্যবহার জেনারেটিভ AI নিষিদ্ধ ব্যবহারের নীতি এবং জেমিনি API পরিষেবার শর্তাবলীর অধীন৷
মডেল বৈকল্পিক
Gemini API বিভিন্ন মডেল অফার করে যা নির্দিষ্ট ব্যবহারের ক্ষেত্রে অপ্টিমাইজ করা হয়। এখানে মিথুন ভেরিয়েন্টগুলির একটি সংক্ষিপ্ত বিবরণ রয়েছে যা উপলব্ধ:
মডেল বৈকল্পিক | ইনপুট(গুলি) | আউটপুট | জন্য অপ্টিমাইজ করা হয়েছে |
---|---|---|---|
Gemini 1.5 Pro (প্রিভিউ) | অডিও, ছবি, এবং পাঠ্য | পাঠ্য | কোড এবং টেক্সট জেনারেশন, টেক্সট এডিটিং, সমস্যা সমাধান, ডেটা এক্সট্রাকশন এবং জেনারেশন সহ যুক্তিযুক্ত কাজগুলি (তবে সীমাবদ্ধ নয়) |
মিথুন 1.5 ফ্ল্যাশ (প্রিভিউ) | অডিও, ছবি, এবং পাঠ্য | পাঠ্য | বিভিন্ন ধরনের কাজ জুড়ে দ্রুত এবং বহুমুখী কর্মক্ষমতা |
জেমিনি 1.0 প্রো | পাঠ্য | পাঠ্য | প্রাকৃতিক ভাষার কাজ, মাল্টি-টার্ন টেক্সট এবং কোড চ্যাট এবং কোড জেনারেশন |
জেমিনি 1.0 প্রো ভিশন | ছবি এবং পাঠ্য | পাঠ্য | ভিজ্যুয়াল-সম্পর্কিত কাজগুলির জন্য পারফরম্যান্স অপ্টিমাইজ করা হয়েছে, যেমন চিত্রের বিবরণ তৈরি করা বা ছবিতে বস্তুগুলি সনাক্ত করা |
পাঠ্য এমবেডিং | পাঠ্য | টেক্সট এম্বেডিং | 2,048 টোকেন পর্যন্ত পাঠ্যের জন্য 768 মাত্রা পর্যন্ত ইলাস্টিক টেক্সট এম্বেডিং তৈরি করুন |
এমবেডিং | পাঠ্য | টেক্সট এম্বেডিং | 2,048 টোকেন পর্যন্ত পাঠ্যের জন্য 768 মাত্রা সহ পাঠ্য এম্বেডিং তৈরি করুন |
AQA | পাঠ্য | পাঠ্য | প্রদত্ত পাঠ্যের উপর অ্যাট্রিবিউটেড প্রশ্ন-উত্তর-সম্পর্কিত কাজগুলি সম্পাদন করুন |
নিম্নলিখিত সারণীতে মিথুন মডেলের বৈশিষ্ট্যগুলি বর্ণনা করা হয়েছে যা সমস্ত মডেলের বৈকল্পিকগুলির জন্য সাধারণ:
বৈশিষ্ট্য | বর্ণনা |
---|---|
প্রশিক্ষণ তথ্য | মিথুনের জ্ঞান কাটঅফ 2023 সালের শুরুর দিকে। সেই সময়ের পরে ঘটনা সম্পর্কে জ্ঞান সীমিত। |
সমর্থিত ভাষা | উপলব্ধ ভাষা দেখুন |
কনফিগারযোগ্য মডেল পরামিতি |
|
এই প্রতিটি প্যারামিটার সম্পর্কে তথ্যের জন্য জেনারেটিভ মডেল গাইডের মডেল প্যারামিটার বিভাগটি দেখুন।
Gemini 1.5 Pro (প্রিভিউ)
জেমিনি 1.5 প্রো হল একটি মাঝারি আকারের মাল্টিমোডাল মডেল যা বিস্তৃত যুক্তিযুক্ত কাজের জন্য অপ্টিমাইজ করা হয়েছে যেমন:
- কোড প্রজন্ম
- পাঠ্য প্রজন্ম
- পাঠ্য সম্পাদনা
- সমস্যা সমাধান
- সুপারিশ প্রজন্ম
- তথ্য নিষ্কাশন
- তথ্য নিষ্কাশন বা প্রজন্ম
- এআই এজেন্ট তৈরি করা
1.5 Pro একসাথে 1 ঘন্টা ভিডিও, 9.5 ঘন্টার অডিও, 30,000 লাইনের কোড বা 700,000 শব্দের বেশি কোডবেস সহ প্রচুর পরিমাণে ডেটা প্রক্রিয়া করতে পারে৷
1.5 Pro শূন্য-, এক-, এবং কয়েক-শট শেখার কাজগুলি পরিচালনা করতে সক্ষম।
মডেলের বিবরণ
সম্পত্তি | বর্ণনা |
---|---|
কোড এর নকশা | models/gemini-1.5-pro-latest |
ইনপুট | অডিও, ছবি, এবং পাঠ্য |
আউটপুট | পাঠ্য |
সমর্থিত প্রজন্মের পদ্ধতি | generateContent |
ইনপুট টোকেন সীমা [**] | 1,048,576 |
আউটপুট টোকেন সীমা [**] | 8,192 |
প্রতি প্রম্পটে সর্বাধিক সংখ্যক ছবি | ৩,৬০০ |
ভিডিওর সর্বোচ্চ দৈর্ঘ্য | 1 ঘন্টা |
সর্বাধিক অডিও দৈর্ঘ্য | প্রায় 9.5 ঘন্টা |
প্রতি প্রম্পটে অডিও ফাইলের সর্বোচ্চ সংখ্যা | 1 |
মডেল নিরাপত্তা | স্বয়ংক্রিয়ভাবে প্রয়োগ করা সুরক্ষা সেটিংস যা বিকাশকারীদের দ্বারা সামঞ্জস্যযোগ্য। বিস্তারিত জানার জন্য নিরাপত্তা সেটিংস আমাদের পৃষ্ঠা দেখুন. |
হার সীমা [*] |
|
সিস্টেম নির্দেশাবলী | সমর্থিত |
JSON মোড | সমর্থিত |
সর্বশেষ সংস্করণ | gemini-1.5-pro-latest |
সর্বশেষ স্থিতিশীল সংস্করণ | gemini-1.5-pro |
সর্বশেষ আপডেট | এপ্রিল 2024 |
মিথুন 1.5 ফ্ল্যাশ (প্রিভিউ)
জেমিনি 1.5 ফ্ল্যাশ হল একটি দ্রুত এবং বহুমুখী মাল্টিমডাল মডেল যা বিভিন্ন কাজ জুড়ে স্কেলিং করার জন্য।
মডেলের বিবরণ
সম্পত্তি | বর্ণনা |
---|---|
কোড এর নকশা | gemini-1.5-flash |
ইনপুট(গুলি) | অডিও, ছবি, এবং পাঠ্য |
আউটপুট | পাঠ্য |
সমর্থিত প্রজন্মের পদ্ধতি | generateContent |
ইনপুট টোকেন সীমা [**] | 1,048,576 |
আউটপুট টোকেন সীমা [**] | 8,192 |
প্রতি প্রম্পটে সর্বাধিক সংখ্যক ছবি | ৩,৬০০ |
ভিডিওর সর্বোচ্চ দৈর্ঘ্য | 1 ঘন্টা |
সর্বাধিক অডিও দৈর্ঘ্য | প্রায় 9.5 ঘন্টা |
প্রতি প্রম্পটে অডিও ফাইলের সর্বোচ্চ সংখ্যা | 1 |
মডেল নিরাপত্তা | স্বয়ংক্রিয়ভাবে প্রয়োগ করা সুরক্ষা সেটিংস যা বিকাশকারীদের দ্বারা সামঞ্জস্যযোগ্য। বিস্তারিত জানার জন্য নিরাপত্তা সেটিংস আমাদের পৃষ্ঠা দেখুন. |
হার সীমা [*] |
|
সিস্টেম নির্দেশাবলী | সমর্থিত |
JSON মোড | সমর্থিত |
সর্বশেষ সংস্করণ | gemini-1.5-flash-latest |
সর্বশেষ স্থিতিশীল সংস্করণ | gemini-1.5-flash |
জেমিনি 1.0 প্রো
Gemini 1.0 Pro হল একটি NLP মডেল যা মাল্টি-টার্ন টেক্সট এবং কোড চ্যাট এবং কোড জেনারেশনের মতো কাজগুলি পরিচালনা করে।
1.0 Pro শূন্য-, এক-, এবং কয়েক-শট শেখার কাজগুলি পরিচালনা করতে সক্ষম।
মডেলের বিবরণ
সম্পত্তি | বর্ণনা |
---|---|
কোড এর নকশা | models/gemini-pro |
ইনপুট | পাঠ্য |
আউটপুট | পাঠ্য |
সমর্থিত প্রজন্মের পদ্ধতি | generate_content generateContent |
হার সীমা [*] |
|
সিস্টেম নির্দেশাবলী | অসমর্থিত |
JSON মোড | অসমর্থিত |
সর্বশেষ সংস্করণ | gemini-1.0-pro-latest |
সর্বশেষ স্থিতিশীল সংস্করণ | gemini-1.0-pro |
স্থিতিশীল সংস্করণ | gemini-1.0-pro-001 |
সর্বশেষ আপডেট | ফেব্রুয়ারি 2024 |
জেমিনি 1.0 প্রো ভিশন
জেমিনি 1.0 প্রো ভিশন হল একটি পারফরম্যান্স-অপ্টিমাইজ করা মাল্টিমোডাল মডেল যা ভিজ্যুয়াল-সম্পর্কিত কাজগুলি সম্পাদন করতে পারে। উদাহরণস্বরূপ, 1.0 প্রো ভিশন চিত্রের বর্ণনা তৈরি করতে পারে, চিত্রগুলিতে উপস্থিত বস্তুগুলি সনাক্ত করতে পারে, চিত্রগুলিতে উপস্থিত স্থান বা বস্তু সম্পর্কে তথ্য প্রদান করতে পারে এবং আরও অনেক কিছু।
1.0 প্রো ভিশন শূন্য-, এক- এবং কয়েকটি-শট কাজগুলি পরিচালনা করতে সক্ষম।
মডেলের বিবরণ
সম্পত্তি | বর্ণনা |
---|---|
কোড এর নকশা | models/gemini-pro-vision |
ইনপুট | টেক্সট এবং ইমেজ |
আউটপুট | পাঠ্য |
সমর্থিত প্রজন্মের পদ্ধতি | generate_content generateContent |
ইনপুট টোকেন সীমা [*] | 12,288 |
আউটপুট টোকেন সীমা [*] | ৪,০৯৬ |
সর্বাধিক ছবির আকার | সীমাহীন |
প্রতি প্রম্পটে সর্বাধিক সংখ্যক ছবি | 16 |
ভিডিওর সর্বোচ্চ দৈর্ঘ্য | ২ মিনিট |
প্রতি প্রম্পটে ভিডিওর সর্বোচ্চ সংখ্যা | 1 |
মডেল নিরাপত্তা | স্বয়ংক্রিয়ভাবে প্রয়োগ করা সুরক্ষা সেটিংস যা বিকাশকারীদের দ্বারা সামঞ্জস্যযোগ্য। বিস্তারিত জানার জন্য নিরাপত্তা সেটিংস আমাদের পৃষ্ঠা দেখুন. |
হারের সীমা [*] | প্রতি মিনিটে 60টি অনুরোধ |
সর্বশেষ সংস্করণ | gemini-1.0-pro-vision-latest |
সর্বশেষ স্থিতিশীল সংস্করণ | gemini-1.0-pro-vision |
সর্বশেষ আপডেট | ডিসেম্বর 2023 |
টেক্সট এম্বেডিং এবং এমবেডিং
পাঠ্য এমবেডিং
ইনপুট টেক্সটের জন্য টেক্সট এমবেডিং তৈরি করতে আপনি টেক্সট এমবেডিং মডেল ব্যবহার করতে পারেন। টেক্সট এমবেডিং মডেল সম্পর্কে আরও তথ্যের জন্য, টেক্সট এম্বেডিং সম্পর্কে Vertex AI ডকুমেন্টেশনের জেনারেটিভ এআই দেখুন।
টেক্সট এমবেডিং মডেলটি 2,048 টোকেন পর্যন্ত টেক্সটের জন্য 768 মাত্রা সহ এমবেডিং তৈরি করার জন্য অপ্টিমাইজ করা হয়েছে। টেক্সট এম্বেডিং 768-এর নিচে ইলাস্টিক এমবেডিং মাপ অফার করে। ছোট আউটপুট ডাইমেনশন তৈরি করতে আপনি ইলাস্টিক এম্বেডিং ব্যবহার করতে পারেন এবং ছোটখাট কর্মক্ষমতা ক্ষতির সাথে কম্পিউটিং এবং স্টোরেজ খরচ সাশ্রয় করতে পারেন।
মডেলের বিবরণ
সম্পত্তি | বর্ণনা |
---|---|
কোড এর নকশা | models/text-embedding-004 ( text-embedding-preview-0409 ভার্টেক্স এআই ) |
ইনপুট | পাঠ্য |
আউটপুট | টেক্সট এম্বেডিং |
ইনপুট টোকেন সীমা | 2,048 |
আউটপুট মাত্রা আকার | 768 |
সমর্থিত প্রজন্মের পদ্ধতি | embed_content embedContent |
মডেল নিরাপত্তা | কোন সামঞ্জস্যযোগ্য নিরাপত্তা সেটিংস. |
হারের সীমা [*] | প্রতি মিনিটে 1,500টি অনুরোধ |
সর্বশেষ আপডেট | এপ্রিল 2024 |
এমবেডিং
আপনি ইনপুট পাঠ্যের জন্য টেক্সট এম্বেডিং তৈরি করতে এমবেডিং মডেল ব্যবহার করতে পারেন।
এমবেডিং মডেলটি 2,048 টোকেন পর্যন্ত পাঠ্যের জন্য 768 মাত্রা সহ এমবেডিং তৈরি করার জন্য অপ্টিমাইজ করা হয়েছে।
মডেল বিশদ এম্বেডিং
সম্পত্তি | বর্ণনা |
---|---|
কোড এর নকশা | models/embedding-001 |
ইনপুট | পাঠ্য |
আউটপুট | টেক্সট এম্বেডিং |
ইনপুট টোকেন সীমা | 2,048 |
আউটপুট মাত্রা আকার | 768 |
সমর্থিত প্রজন্মের পদ্ধতি | embed_content embedContent |
মডেল নিরাপত্তা | কোন সামঞ্জস্যযোগ্য নিরাপত্তা সেটিংস. |
হারের সীমা [*] | প্রতি মিনিটে 1,500টি অনুরোধ |
সর্বশেষ আপডেট | ডিসেম্বর 2023 |
AQA
আপনি AQA মডেল ব্যবহার করতে পারেন অ্যাট্রিবিউটেড প্রশ্ন-উত্তর প্রদান (AQA)-এর সাথে সম্পর্কিত কাজগুলি একটি নথি, কর্পাস বা প্যাসেজের একটি সেটে। AQA মডেল প্রশ্নগুলির উত্তর দেয় যেগুলি প্রদত্ত উত্সগুলিতে ভিত্তি করে, উত্তরযোগ্য সম্ভাব্যতার অনুমান সহ।
মডেলের বিবরণ
সম্পত্তি | বর্ণনা |
---|---|
কোড এর নকশা | models/aqa |
ইনপুট | পাঠ্য |
আউটপুট | পাঠ্য |
সমর্থিত প্রজন্মের পদ্ধতি | GenerateAnswerRequest generateAnswer |
সমর্থিত ভাষা | ইংরেজি |
ইনপুট টোকেন সীমা [**] | 7,168 |
আউটপুট টোকেন সীমা [**] | 1,024 |
মডেল নিরাপত্তা | স্বয়ংক্রিয়ভাবে প্রয়োগ করা সুরক্ষা সেটিংস যা বিকাশকারীদের দ্বারা সামঞ্জস্যযোগ্য। বিস্তারিত জানার জন্য নিরাপত্তা সেটিংস আমাদের পৃষ্ঠা দেখুন. |
হারের সীমা [*] | প্রতি মিনিটে 60টি অনুরোধ |
সর্বশেষ আপডেট | ডিসেম্বর 2023 |
এই মডেল বৈচিত্রগুলির ক্ষমতাগুলি অন্বেষণ করতে উদাহরণগুলি দেখুন৷
[*] মিথুন মডেলের জন্য একটি টোকেন প্রায় 4টি অক্ষরের সমতুল্য। 100 টোকেন প্রায় 60-80 ইংরেজি শব্দ।
[**] RPM: প্রতি মিনিটে অনুরোধ
TPM: প্রতি মিনিটে টোকেন
RPD: প্রতিদিনের অনুরোধ
TPD: প্রতিদিন টোকেন
ক্ষমতার সীমাবদ্ধতার কারণে, নির্দিষ্ট সর্বোচ্চ হারের সীমা নিশ্চিত করা হয় না।
মডেল সংস্করণ নামের নিদর্শন
মিথুন মডেলগুলি পূর্বরূপ বা স্থিতিশীল সংস্করণে উপলব্ধ। আপনার কোডে, আপনি কোন মডেল এবং সংস্করণটি ব্যবহার করতে চান তা নির্দিষ্ট করতে আপনি নিম্নলিখিত মডেল নামের ফর্ম্যাটগুলির মধ্যে একটি ব্যবহার করতে পারেন৷
সর্বশেষ: একটি নির্দিষ্ট প্রজন্ম এবং প্রকরণের জন্য মডেলের অত্যাধুনিক সংস্করণের দিকে নির্দেশ করে৷ অন্তর্নিহিত মডেল নিয়মিত আপডেট করা হয় এবং একটি পূর্বরূপ সংস্করণ হতে পারে. শুধুমাত্র অনুসন্ধানমূলক পরীক্ষামূলক অ্যাপ এবং প্রোটোটাইপ এই উপনাম ব্যবহার করা উচিত।
সর্বশেষ সংস্করণ নির্দিষ্ট করতে, নিম্নলিখিত প্যাটার্নটি ব্যবহার করুন:
<model>-<generation>-<variation>-latest
। উদাহরণস্বরূপ,gemini-1.0-pro-latest
।সর্বশেষ স্থিতিশীল: নির্দিষ্ট মডেল জেনারেশন এবং প্রকরণের জন্য প্রকাশিত সবচেয়ে সাম্প্রতিক স্থিতিশীল সংস্করণের দিকে নির্দেশ করে।
সর্বশেষ স্থিতিশীল সংস্করণ নির্দিষ্ট করতে, নিম্নলিখিত প্যাটার্নটি ব্যবহার করুন:
<model>-<generation>-<variation>
। উদাহরণস্বরূপ,gemini-1.0-pro
।স্থিতিশীল: একটি নির্দিষ্ট স্থিতিশীল মডেলের দিকে নির্দেশ করে। স্থিতিশীল মডেল পরিবর্তন হয় না. বেশিরভাগ উৎপাদন অ্যাপের একটি নির্দিষ্ট স্থিতিশীল মডেল ব্যবহার করা উচিত।
একটি স্থিতিশীল সংস্করণ নির্দিষ্ট করতে, নিম্নলিখিত প্যাটার্নটি ব্যবহার করুন:
<model>-<generation>-<variation>-<version>
। উদাহরণস্বরূপ,gemini-1.0-pro-001
।