Gemini

জেমিনি হল জেনারেটিভ এআই মডেলের একটি পরিবার যা ডেভেলপারদের বিষয়বস্তু তৈরি করতে এবং সমস্যার সমাধান করতে দেয়। এই মডেলগুলি ইনপুট হিসাবে পাঠ্য এবং চিত্র উভয়ই পরিচালনা করার জন্য ডিজাইন এবং প্রশিক্ষিত। এই নির্দেশিকাটি আপনার ব্যবহারের ক্ষেত্রে কোনটি সবচেয়ে উপযুক্ত তা নির্ধারণ করতে আপনাকে সাহায্য করার জন্য প্রতিটি মডেলের বৈকল্পিক সম্পর্কে তথ্য প্রদান করে।

উপলব্ধ ভাষা

মিথুন মডেলদের নিম্নলিখিত ভাষার সাথে কাজ করার জন্য প্রশিক্ষণ দেওয়া হয়: আরবি ( ar ), বাংলা ( bn ), বুলগেরিয়ান ( bg ), চীনা সরলীকৃত এবং ঐতিহ্যবাহী ( zh ), ক্রোয়েশিয়ান ( hr ), চেক ( cs ), ডেনিশ ( da ), ডাচ ( nl ), ইংরেজি ( en ), এস্তোনিয়ান ( et ), ফিনিশ ( fi ), ফরাসি ( fr ), জার্মান ( de ), গ্রীক ( el ), হিব্রু ( iw ), হিন্দি ( hi ), হাঙ্গেরিয়ান ( hu ), ইন্দোনেশিয়ান ( id ), ইতালীয় ( it ), জাপানি ( ja ), কোরিয়ান ( ko ), লাটভিয়ান ( lv ), লিথুয়ানিয়ান ( lt ), নরওয়েজিয়ান ( no ), পোলিশ ( pl ), পর্তুগিজ ( pt ), রোমানিয়ান ( ro ), রাশিয়ান ( ru ), সার্বিয়ান ( sr ), স্লোভাক ( sk ), স্লোভেনীয় ( sl ), স্প্যানিশ ( es ), সোয়াহিলি ( sw ), সুইডিশ ( sv ), থাই ( th ), তুর্কি ( tr ), ইউক্রেনীয় ( uk ), এবং ভিয়েতনামী ( vi )।

PaLM মডেলগুলি শুধুমাত্র ইংরেজিতে ভাল কাজ করে। অন্যান্য ভাষা ব্যবহার করলে অপ্রত্যাশিত ফলাফল হতে পারে।

মডেল বৈকল্পিক

Gemini API বিভিন্ন মডেল অফার করে যা নির্দিষ্ট ব্যবহারের ক্ষেত্রে অপ্টিমাইজ করা হয়। এখানে মিথুন ভেরিয়েন্টগুলির একটি সংক্ষিপ্ত বিবরণ রয়েছে যা উপলব্ধ:

মডেল বৈকল্পিক ইনপুট(গুলি) আউটপুট জন্য অপ্টিমাইজ করা হয়েছে
মিথুন 1.5 প্রো
gemini-1.5-pro
অডিও, ছবি, ভিডিও এবং পাঠ্য পাঠ্য জটিল যুক্তির কাজ যেমন কোড এবং টেক্সট জেনারেশন, টেক্সট এডিটিং, সমস্যা সমাধান, ডেটা এক্সট্রাকশন এবং জেনারেশন
মিথুন 1.5 ফ্ল্যাশ
gemini-1.5-flash
অডিও, ছবি, ভিডিও এবং পাঠ্য পাঠ্য বিভিন্ন ধরনের কাজ জুড়ে দ্রুত এবং বহুমুখী কর্মক্ষমতা
জেমিনি 1.0 প্রো
gemini-1.0-pro
পাঠ্য পাঠ্য প্রাকৃতিক ভাষার কাজ, মাল্টি-টার্ন টেক্সট এবং কোড চ্যাট এবং কোড জেনারেশন
জেমিনি 1.0 প্রো ভিশন
gemini-pro-vision
ছবি, ভিডিও এবং পাঠ্য পাঠ্য ভিজ্যুয়াল-সম্পর্কিত কাজগুলি, যেমন চিত্রের বর্ণনা তৈরি করা বা ছবিতে বস্তু শনাক্ত করা
পাঠ্য এমবেডিং
text-embedding-004
পাঠ্য টেক্সট এম্বেডিং টেক্সট স্ট্রিং এর সংশ্লিষ্টতা পরিমাপ

নিম্নলিখিত সারণীতে মিথুন মডেলের বৈশিষ্ট্যগুলি বর্ণনা করা হয়েছে যা সমস্ত মডেলের রূপের জন্য সাধারণ:

বৈশিষ্ট্য বর্ণনা
প্রশিক্ষণ তথ্য মিথুনের জ্ঞান কাটঅফ নভেম্বর 2023৷ সেই সময়ের পরে ঘটনাগুলি সম্পর্কে জ্ঞান সীমিত৷
সমর্থিত ভাষা উপলব্ধ ভাষা দেখুন
কনফিগারযোগ্য মডেল পরামিতি
  • শীর্ষ পি
  • শীর্ষ k
  • তাপমাত্রা
  • ক্রম বন্ধ করুন
  • সর্বোচ্চ আউটপুট দৈর্ঘ্য
  • প্রতিক্রিয়া প্রার্থীদের সংখ্যা

এই প্রতিটি প্যারামিটার সম্পর্কে তথ্যের জন্য জেনারেটিভ মডেল গাইডের মডেল প্যারামিটার বিভাগটি দেখুন।

মিথুন 1.5 প্রো

জেমিনি 1.5 প্রো হল একটি মাঝারি আকারের মাল্টিমোডাল মডেল যা বিস্তৃত যুক্তিযুক্ত কাজের জন্য অপ্টিমাইজ করা হয়েছে যেমন:

  • কোড প্রজন্ম
  • পাঠ্য প্রজন্ম
  • পাঠ্য সম্পাদনা
  • সমস্যা সমাধান
  • সুপারিশ প্রজন্ম
  • তথ্য নিষ্কাশন
  • তথ্য নিষ্কাশন বা প্রজন্ম
  • এআই এজেন্ট তৈরি করা

1.5 Pro একসাথে 1 ঘন্টা ভিডিও, 9.5 ঘন্টার অডিও, 30,000 লাইনের কোড বা 700,000 শব্দের বেশি কোডবেস সহ প্রচুর পরিমাণে ডেটা প্রক্রিয়া করতে পারে৷

1.5 Pro শূন্য-, এক-, এবং কয়েক-শট শেখার কাজগুলি পরিচালনা করতে সক্ষম।

মডেলের বিবরণ

সম্পত্তি বর্ণনা
কোড এর নকশা models/gemini-1.5-pro-latest
ইনপুট অডিও, ছবি, ভিডিও এবং পাঠ্য
আউটপুট পাঠ্য
সমর্থিত প্রজন্মের পদ্ধতি generateContent
ইনপুট টোকেন সীমা [**] 1,048,576
আউটপুট টোকেন সীমা [**] 8,192
প্রতি প্রম্পটে সর্বাধিক সংখ্যক ছবি ৩,৬০০
ভিডিওর সর্বোচ্চ দৈর্ঘ্য 1 ঘন্টা
সর্বাধিক অডিও দৈর্ঘ্য প্রায় 9.5 ঘন্টা
প্রতি প্রম্পটে অডিও ফাইলের সর্বোচ্চ সংখ্যা 1
মডেল নিরাপত্তা স্বয়ংক্রিয়ভাবে প্রয়োগ করা সুরক্ষা সেটিংস যা বিকাশকারীদের দ্বারা সামঞ্জস্যযোগ্য। বিস্তারিত জানার জন্য নিরাপত্তা সেটিংস আমাদের পৃষ্ঠা দেখুন.
হার সীমা [*]
বিনামূল্যে:
  • 2 RPM
  • 32,000 টিপিএম
  • 50 RPD
  • 46,080,000 TPD
যেমনি খরচ তেমনি পরিশোধ:
  • 360 RPM
  • 10 মিলিয়ন TPM
  • 10,000 RPD
  • 14,400,000,000 TPD
দুই মিলিয়ন প্রসঙ্গ:
  • 1 RPM
  • 2 মিলিয়ন টিপিএম
  • 50 RPD
সিস্টেম নির্দেশাবলী সমর্থিত
JSON মোড সমর্থিত
সর্বশেষ সংস্করণ gemini-1.5-pro-latest
সর্বশেষ স্থিতিশীল সংস্করণ gemini-1.5-pro
স্থিতিশীল সংস্করণ gemini-1.5-pro-001
সর্বশেষ আপডেট মে 2024

মিথুন 1.5 ফ্ল্যাশ

জেমিনি 1.5 ফ্ল্যাশ হল একটি দ্রুত এবং বহুমুখী মাল্টিমডাল মডেল যা বিভিন্ন কাজ জুড়ে স্কেলিং করার জন্য।

মডেলের বিবরণ

সম্পত্তি বর্ণনা
কোড এর নকশা gemini-1.5-flash-latest
ইনপুট(গুলি) অডিও, ছবি, ভিডিও এবং পাঠ্য
আউটপুট পাঠ্য
সমর্থিত প্রজন্মের পদ্ধতি generateContent
ইনপুট টোকেন সীমা [**] 1,048,576
আউটপুট টোকেন সীমা [**] 8,192
প্রতি প্রম্পটে সর্বাধিক সংখ্যক ছবি ৩,৬০০
ভিডিওর সর্বোচ্চ দৈর্ঘ্য 1 ঘন্টা
সর্বাধিক অডিও দৈর্ঘ্য প্রায় 9.5 ঘন্টা
প্রতি প্রম্পটে অডিও ফাইলের সর্বোচ্চ সংখ্যা 1
মডেল নিরাপত্তা স্বয়ংক্রিয়ভাবে প্রয়োগ করা সুরক্ষা সেটিংস যা বিকাশকারীদের দ্বারা সামঞ্জস্যযোগ্য। বিস্তারিত জানার জন্য নিরাপত্তা সেটিংস আমাদের পৃষ্ঠা দেখুন.
হার সীমা [*]
বিনামূল্যে:
  • 15 RPM
  • 1 মিলিয়ন টিপিএম
  • 1500 RPD
যেমনি খরচ তেমনি পরিশোধ:
  • 360 RPM
  • 10 মিলিয়ন TPM
  • 10,000 RPD
সিস্টেম নির্দেশাবলী সমর্থিত
JSON মোড সমর্থিত
সর্বশেষ সংস্করণ gemini-1.5-flash-latest
সর্বশেষ স্থিতিশীল সংস্করণ gemini-1.5-flash
স্থিতিশীল সংস্করণ gemini-1.5-flash-001
সর্বশেষ আপডেট মে 2024

জেমিনি 1.0 প্রো

Gemini 1.0 Pro হল একটি NLP মডেল যা মাল্টি-টার্ন টেক্সট এবং কোড চ্যাট এবং কোড জেনারেশনের মতো কাজগুলি পরিচালনা করে।

1.0 Pro শূন্য-, এক-, এবং কয়েক-শট শেখার কাজগুলি পরিচালনা করতে সক্ষম।

মডেলের বিবরণ

সম্পত্তি বর্ণনা
কোড এর নকশা models/gemini-1.0-pro
ইনপুট পাঠ্য
আউটপুট পাঠ্য
সমর্থিত প্রজন্মের পদ্ধতি
Python: generate_content
REST: generateContent
হার সীমা [*]
বিনামূল্যে:
  • 15 RPM
  • 32,000 টিপিএম
  • 1,500 RPD
  • 46,080,000 TPD
যেমনি খরচ তেমনি পরিশোধ:
  • 360 RPM
  • 120,000 TPM
  • 30,000 RPD
  • 172,800,000 TPD
সিস্টেম নির্দেশাবলী অসমর্থিত
JSON মোড অসমর্থিত
সর্বশেষ সংস্করণ gemini-1.0-pro-latest
সর্বশেষ স্থিতিশীল সংস্করণ gemini-1.0-pro
স্থিতিশীল সংস্করণ gemini-1.0-pro-001
সর্বশেষ আপডেট ফেব্রুয়ারি 2024

জেমিনি 1.0 প্রো ভিশন

জেমিনি 1.0 প্রো ভিশন হল একটি পারফরম্যান্স-অপ্টিমাইজ করা মাল্টিমোডাল মডেল যা ভিজ্যুয়াল-সম্পর্কিত কাজগুলি সম্পাদন করতে পারে। উদাহরণস্বরূপ, 1.0 প্রো ভিশন চিত্রের বর্ণনা তৈরি করতে পারে, চিত্রগুলিতে উপস্থিত বস্তুগুলি সনাক্ত করতে পারে, চিত্রগুলিতে উপস্থিত স্থান বা বস্তু সম্পর্কে তথ্য প্রদান করতে পারে এবং আরও অনেক কিছু।

1.0 প্রো ভিশন শূন্য-, এক- এবং কয়েকটি-শট কাজগুলি পরিচালনা করতে সক্ষম।

মডেলের বিবরণ

সম্পত্তি বর্ণনা
কোড এর নকশা models/gemini-pro-vision
ইনপুট পাঠ্য, ভিডিও এবং চিত্র
আউটপুট পাঠ্য
সমর্থিত প্রজন্মের পদ্ধতি
Python: generate_content
REST: generateContent
ইনপুট টোকেন সীমা [*] 12,288
আউটপুট টোকেন সীমা [*] ৪,০৯৬
সর্বাধিক ছবির আকার সীমাহীন
প্রতি প্রম্পটে সর্বাধিক সংখ্যক ছবি 16
ভিডিওর সর্বোচ্চ দৈর্ঘ্য ২ মিনিট
প্রতি প্রম্পটে ভিডিওর সর্বোচ্চ সংখ্যা 1
মডেল নিরাপত্তা স্বয়ংক্রিয়ভাবে প্রয়োগ করা সুরক্ষা সেটিংস যা বিকাশকারীদের দ্বারা সামঞ্জস্যযোগ্য। বিস্তারিত জানার জন্য নিরাপত্তা সেটিংস আমাদের পৃষ্ঠা দেখুন.
হারের সীমা [*] প্রতি মিনিটে 60টি অনুরোধ
সর্বশেষ সংস্করণ gemini-1.0-pro-vision-latest
সর্বশেষ স্থিতিশীল সংস্করণ gemini-1.0-pro-vision
সর্বশেষ আপডেট ডিসেম্বর 2023

টেক্সট এম্বেডিং এবং এমবেডিং

পাঠ্য এমবেডিং

ইনপুট টেক্সটের জন্য টেক্সট এমবেডিং তৈরি করতে আপনি টেক্সট এমবেডিং মডেল ব্যবহার করতে পারেন। টেক্সট এমবেডিং মডেল সম্পর্কে আরও তথ্যের জন্য, টেক্সট এম্বেডিং সম্পর্কে Vertex AI ডকুমেন্টেশনের জেনারেটিভ এআই দেখুন।

টেক্সট এমবেডিং মডেলটি 2,048 টোকেন পর্যন্ত টেক্সটের জন্য 768 মাত্রা সহ এমবেডিং তৈরি করার জন্য অপ্টিমাইজ করা হয়েছে। টেক্সট এম্বেডিং 768-এর নিচে ইলাস্টিক এমবেডিং মাপ অফার করে। ছোট আউটপুট ডাইমেনশন তৈরি করতে আপনি ইলাস্টিক এম্বেডিং ব্যবহার করতে পারেন এবং ছোটখাট কর্মক্ষমতা ক্ষতির সাথে কম্পিউটিং এবং স্টোরেজ খরচ সাশ্রয় করতে পারেন।

মডেলের বিবরণ
সম্পত্তি বর্ণনা
কোড এর নকশা models/text-embedding-004 ( text-embedding-preview-0409 ভার্টেক্স এআই )
ইনপুট পাঠ্য
আউটপুট টেক্সট এম্বেডিং
ইনপুট টোকেন সীমা 2,048
আউটপুট মাত্রা আকার 768
সমর্থিত প্রজন্মের পদ্ধতি
Python: embed_content
REST: embedContent
মডেল নিরাপত্তা কোন সামঞ্জস্যযোগ্য নিরাপত্তা সেটিংস.
হারের সীমা [*] প্রতি মিনিটে 1,500টি অনুরোধ
সর্বশেষ আপডেট এপ্রিল 2024

এমবেডিং

আপনি ইনপুট পাঠ্যের জন্য টেক্সট এম্বেডিং তৈরি করতে এমবেডিং মডেল ব্যবহার করতে পারেন।

এমবেডিং মডেলটি 2,048 টোকেন পর্যন্ত পাঠ্যের জন্য 768 মাত্রা সহ এমবেডিং তৈরি করার জন্য অপ্টিমাইজ করা হয়েছে।

মডেল বিশদ এম্বেডিং
সম্পত্তি বর্ণনা
কোড এর নকশা models/embedding-001
ইনপুট পাঠ্য
আউটপুট টেক্সট এম্বেডিং
ইনপুট টোকেন সীমা 2,048
আউটপুট মাত্রা আকার 768
সমর্থিত প্রজন্মের পদ্ধতি
Python: embed_content
REST: embedContent
মডেল নিরাপত্তা কোন সামঞ্জস্যযোগ্য নিরাপত্তা সেটিংস.
হারের সীমা [*] প্রতি মিনিটে 1,500টি অনুরোধ
সর্বশেষ আপডেট ডিসেম্বর 2023

AQA

আপনি AQA মডেল ব্যবহার করতে পারেন অ্যাট্রিবিউটেড প্রশ্ন-উত্তর প্রদান (AQA)-এর সাথে সম্পর্কিত কাজগুলি একটি নথি, কর্পাস বা প্যাসেজের একটি সেটে। AQA মডেল প্রশ্নগুলির উত্তর দেয় যেগুলি প্রদত্ত উত্সগুলিতে ভিত্তি করে, উত্তরযোগ্য সম্ভাব্যতার অনুমান সহ।

মডেলের বিবরণ

সম্পত্তি বর্ণনা
কোড এর নকশা models/aqa
ইনপুট পাঠ্য
আউটপুট পাঠ্য
সমর্থিত প্রজন্মের পদ্ধতি
পাইথন: GenerateAnswerRequest
REST: generateAnswer
সমর্থিত ভাষা ইংরেজি
ইনপুট টোকেন সীমা [**] 7,168
আউটপুট টোকেন সীমা [**] 1,024
মডেল নিরাপত্তা স্বয়ংক্রিয়ভাবে প্রয়োগ করা সুরক্ষা সেটিংস যা বিকাশকারীদের দ্বারা সামঞ্জস্যযোগ্য। বিস্তারিত জানার জন্য নিরাপত্তা সেটিংস আমাদের পৃষ্ঠা দেখুন.
হারের সীমা [*] প্রতি মিনিটে 60টি অনুরোধ
সর্বশেষ আপডেট ডিসেম্বর 2023

এই মডেল বৈচিত্রগুলির ক্ষমতাগুলি অন্বেষণ করতে উদাহরণগুলি দেখুন৷

[*] মিথুন মডেলের জন্য একটি টোকেন প্রায় 4টি অক্ষরের সমতুল্য। 100 টোকেন প্রায় 60-80 ইংরেজি শব্দ।

[**] RPM: প্রতি মিনিটে অনুরোধ
TPM: প্রতি মিনিটে টোকেন
RPD: প্রতিদিনের অনুরোধ
TPD: প্রতিদিন টোকেন

ক্ষমতার সীমাবদ্ধতার কারণে, নির্দিষ্ট সর্বোচ্চ হারের সীমা নিশ্চিত করা হয় না।

মডেল সংস্করণ নামের নিদর্শন

মিথুন মডেলগুলি পূর্বরূপ বা স্থিতিশীল সংস্করণে উপলব্ধ। আপনার কোডে, আপনি কোন মডেল এবং সংস্করণটি ব্যবহার করতে চান তা নির্দিষ্ট করতে আপনি নিম্নলিখিত মডেল নামের ফর্ম্যাটগুলির মধ্যে একটি ব্যবহার করতে পারেন৷

  • সর্বশেষ: একটি নির্দিষ্ট প্রজন্ম এবং প্রকরণের জন্য মডেলের অত্যাধুনিক সংস্করণের দিকে নির্দেশ করে৷ অন্তর্নিহিত মডেল নিয়মিত আপডেট করা হয় এবং একটি পূর্বরূপ সংস্করণ হতে পারে. শুধুমাত্র অনুসন্ধানমূলক পরীক্ষামূলক অ্যাপ এবং প্রোটোটাইপ এই উপনাম ব্যবহার করা উচিত।

    সর্বশেষ সংস্করণ নির্দিষ্ট করতে, নিম্নলিখিত প্যাটার্নটি ব্যবহার করুন: <model>-<generation>-<variation>-latest । উদাহরণস্বরূপ, gemini-1.0-pro-latest

  • সর্বশেষ স্থিতিশীল: নির্দিষ্ট মডেল জেনারেশন এবং প্রকরণের জন্য প্রকাশিত সবচেয়ে সাম্প্রতিক স্থিতিশীল সংস্করণের দিকে নির্দেশ করে।

    সর্বশেষ স্থিতিশীল সংস্করণ নির্দিষ্ট করতে, নিম্নলিখিত প্যাটার্নটি ব্যবহার করুন: <model>-<generation>-<variation> । উদাহরণস্বরূপ, gemini-1.0-pro

  • স্থিতিশীল: একটি নির্দিষ্ট স্থিতিশীল মডেলের দিকে নির্দেশ করে। স্থিতিশীল মডেল পরিবর্তন হয় না. বেশিরভাগ উৎপাদন অ্যাপের একটি নির্দিষ্ট স্থিতিশীল মডেল ব্যবহার করা উচিত।

    একটি স্থিতিশীল সংস্করণ নির্দিষ্ট করতে, নিম্নলিখিত প্যাটার্নটি ব্যবহার করুন: <model>-<generation>-<variation>-<version> । উদাহরণস্বরূপ, gemini-1.0-pro-001