مدل های جوزا

انواع مدل

Gemini API مدل های مختلفی را ارائه می دهد که برای موارد استفاده خاص بهینه شده اند. در اینجا یک مرور مختصر از انواع Gemini موجود است:

نوع مدل ورودی(های) خروجی بهینه شده برای
فلش جمینی 1.5
gemini-1.5-flash
صدا، تصاویر، ویدئوها و متن متن عملکرد سریع و همه کاره در انواع مختلف وظایف
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
صدا، تصاویر، ویدئوها و متن متن وظایف با حجم بالا و هوش کمتر
جمینی 1.5 پرو
gemini-1.5-pro
صدا، تصاویر، ویدئوها و متن متن وظایف استدلالی پیچیده که به هوش بیشتری نیاز دارد
Gemini 1.0 Pro (منسوخ شده در 2025/2/15)
gemini-1.0-pro
متن متن وظایف زبان طبیعی، چت متنی و کد چند نوبتی، و تولید کد
جاسازی متن
text-embedding-004
متن جاسازی متن اندازه گیری ارتباط رشته های متنی
AQA
aqa
متن متن ارائه پاسخ های مبتنی بر منبع به سوالات

فلش جمینی 1.5

Gemini 1.5 Flash یک مدل چندوجهی سریع و همه کاره برای مقیاس‌بندی وظایف مختلف است.

در AI Studio امتحان کنید

جزئیات مدل

اموال توضیحات
کد مدل models/gemini-1.5-flash
انواع داده های پشتیبانی شده

ورودی ها

صدا، تصویر، ویدئو و متن

خروجی

متن

محدودیت های رمز [*]

محدودیت رمز ورودی

1,048,576

محدودیت نشانه خروجی

8,192

مشخصات صوتی/بصری

حداکثر تعداد تصاویر در هر درخواست

3600

حداکثر طول ویدیو

1 ساعت

حداکثر طول صدا

تقریبا 9.5 ساعت

محدودیت‌های نرخ [**]
رایگان:
  • 15 دور در دقیقه
  • 1 میلیون TPM
  • 1500 RPD
پرداخت به موقع:
  • 2000 دور در دقیقه
  • 4 میلیون TPM
قابلیت های

دستورالعمل های سیستم

پشتیبانی می شود

حالت JSON

پشتیبانی می شود

طرحواره JSON

پشتیبانی می شود

تنظیمات ایمنی قابل تنظیم

پشتیبانی می شود

ذخیره سازی

پشتیبانی می شود

تنظیم

پشتیبانی می شود

فراخوانی تابع

پشتیبانی می شود

اجرای کد

پشتیبانی می شود

نسخه
الگوهای نسخه مدل را برای جزئیات بیشتر بخوانید.
  • جدیدترین: gemini-1.5-flash-latest
  • آخرین استبل: gemini-1.5-flash
  • پایدار:
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
آخرین به روز رسانی سپتامبر 2024

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B یک مدل کوچک است که برای کارهای با هوش کمتر طراحی شده است.

در AI Studio امتحان کنید

جزئیات مدل

اموال توضیحات
کد مدل models/gemini-1.5-flash-8b
انواع داده های پشتیبانی شده

ورودی ها

صدا، تصویر، ویدئو و متن

خروجی

متن

محدودیت های رمز [*]

محدودیت رمز ورودی

1,048,576

محدودیت نشانه خروجی

8,192

مشخصات صوتی/بصری

حداکثر تعداد تصاویر در هر درخواست

3600

حداکثر طول ویدیو

1 ساعت

حداکثر طول صدا

تقریبا 9.5 ساعت

محدودیت‌های نرخ [**]
رایگان:
  • 15 دور در دقیقه
  • 1 میلیون TPM
  • 1500 RPD
پرداخت به موقع:
  • 4000 دور در دقیقه
  • 4 میلیون TPM
قابلیت های

دستورالعمل های سیستم

پشتیبانی می شود

حالت JSON

پشتیبانی می شود

طرحواره JSON

پشتیبانی می شود

تنظیمات ایمنی قابل تنظیم

پشتیبانی می شود

ذخیره سازی

پشتیبانی می شود

تنظیم

پشتیبانی می شود

فراخوانی تابع

پشتیبانی می شود

اجرای کد

پشتیبانی می شود

نسخه
الگوهای نسخه مدل را برای جزئیات بیشتر بخوانید.
  • جدیدترین: gemini-1.5-flash-8b-latest
  • آخرین استبل: gemini-1.5-flash-8b
  • پایدار:
    • gemini-1.5-flash-8b-001
آخرین به روز رسانی اکتبر 2024

جمینی 1.5 پرو

Gemini 1.5 Pro یک مدل چندوجهی با اندازه متوسط ​​است که برای طیف وسیعی از وظایف استدلالی بهینه شده است. 1.5 Pro می تواند حجم زیادی از داده ها را همزمان پردازش کند، از جمله 2 ساعت ویدیو، 19 ساعت صدا، پایگاه های کد با 60000 خط کد یا 2000 صفحه متن.

در AI Studio امتحان کنید

جزئیات مدل

اموال توضیحات
کد مدل models/gemini-1.5-pro
انواع داده های پشتیبانی شده

ورودی ها

صدا، تصویر، ویدئو و متن

خروجی

متن

محدودیت های رمز [*]

محدودیت رمز ورودی

2,097,152

محدودیت نشانه خروجی

8,192

مشخصات صوتی/بصری

حداکثر تعداد تصاویر در هر درخواست

7200

حداکثر طول ویدیو

2 ساعت

حداکثر طول صدا

تقریبا 19 ساعت

محدودیت‌های نرخ [**]
رایگان:
  • 2 دور در دقیقه
  • 32000 TPM
  • 50 RPD
پرداخت به موقع:
  • 1000 دور در دقیقه
  • 4 میلیون TPM
قابلیت های

دستورالعمل های سیستم

پشتیبانی می شود

حالت JSON

پشتیبانی می شود

طرحواره JSON

پشتیبانی می شود

تنظیمات ایمنی قابل تنظیم

پشتیبانی می شود

ذخیره سازی

پشتیبانی می شود

تنظیم

پشتیبانی نمی شود

فراخوانی تابع

پشتیبانی می شود

اجرای کد

پشتیبانی می شود

نسخه
الگوهای نسخه مدل را برای جزئیات بیشتر بخوانید.
  • جدیدترین: gemini-1.5-pro-latest
  • آخرین استبل: gemini-1.5-pro
  • پایدار:
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
آخرین به روز رسانی سپتامبر 2024

Gemini 1.0 Pro (منسوخ شده)

Gemini 1.0 Pro یک مدل NLP است که وظایفی مانند چت متنی و کد چند نوبتی و تولید کد را انجام می دهد.

در AI Studio امتحان کنید

جزئیات مدل

اموال توضیحات
کد مدل models/gemini-1.0-pro
انواع داده های پشتیبانی شده

ورودی

متن

خروجی

متن

محدودیت‌های نرخ [**]
رایگان:
  • 15 دور در دقیقه
  • 32000 TPM
  • 1500 RPD
پرداخت به موقع:
  • 360 دور در دقیقه
  • 120000 TPM
  • 30000 RPD
قابلیت های

دستورالعمل های سیستم

پشتیبانی نمی شود

حالت JSON

پشتیبانی نمی شود

طرحواره JSON

پشتیبانی نمی شود

تنظیمات ایمنی قابل تنظیم

پشتیبانی می شود

ذخیره سازی

پشتیبانی نمی شود

تنظیم

پشتیبانی می شود

فراخوانی تابع

پشتیبانی می شود

پیکربندی فراخوانی تابع

پشتیبانی نمی شود

اجرای کد

پشتیبانی نمی شود

نسخه
  • جدیدترین: gemini-1.0-pro-latest
  • آخرین استبل: gemini-1.0-pro
  • پایدار: gemini-1.0-pro-001
آخرین به روز رسانی فوریه 2024

جاسازی و جاسازی متن

جاسازی متن

جاسازی متن برای اندازه گیری ارتباط رشته ها استفاده می شود و به طور گسترده در بسیاری از برنامه های کاربردی هوش مصنوعی استفاده می شود.

text-embedding-004 عملکرد بازیابی قوی‌تری را به دست می‌آورد و از مدل‌های موجود با ابعاد قابل مقایسه در معیارهای استاندارد تعبیه‌سازی MTEB بهتر عمل می‌کند .

جزئیات مدل
اموال توضیحات
کد مدل

Gemini API

models/text-embedding-004

انواع داده های پشتیبانی شده

ورودی

متن

خروجی

جاسازی متن

محدودیت های رمز [*]

محدودیت رمز ورودی

2,048

اندازه ابعاد خروجی

768

محدودیت‌های نرخ [**] 1500 درخواست در دقیقه
تنظیمات امنیتی قابل تنظیم پشتیبانی نمی شود
آخرین به روز رسانی آوریل 2024

جاسازی

می توانید از مدل Embedding برای ایجاد جاسازی متن برای متن ورودی استفاده کنید.

مدل Embedding برای ایجاد جاسازی با 768 بعد برای متن تا 2048 توکن بهینه شده است.

تعبیه جزئیات مدل
اموال توضیحات
کد مدل models/embedding-001
انواع داده های پشتیبانی شده

ورودی

متن

خروجی

جاسازی متن

محدودیت های رمز [*]

محدودیت رمز ورودی

2,048

اندازه ابعاد خروجی

768

محدودیت‌های نرخ [**] 1500 درخواست در دقیقه
تنظیمات امنیتی قابل تنظیم پشتیبانی نمی شود
آخرین به روز رسانی دسامبر 2023

AQA

می توانید از مدل AQA برای انجام وظایف مرتبط با پرسش و پاسخ نسبت داده شده (AQA) در یک سند، مجموعه یا مجموعه ای از متن ها استفاده کنید. مدل AQA به سوالاتی که در منابع ارائه شده پایه گذاری شده اند، به همراه تخمین احتمال پاسخگو پاسخ می دهد.

جزئیات مدل

اموال توضیحات
کد مدل models/aqa
انواع داده های پشتیبانی شده

ورودی

متن

خروجی

متن

پشتیبانی شده انگلیسی
محدودیت های رمز [*]

محدودیت رمز ورودی

7,168

محدودیت نشانه خروجی

1024

محدودیت‌های نرخ [**] 1500 درخواست در دقیقه
تنظیمات امنیتی قابل تنظیم پشتیبانی می شود
آخرین به روز رسانی دسامبر 2023

برای کشف قابلیت‌های این مدل‌ها به مثال‌ها مراجعه کنید.

[*] یک نشانه برای مدل های Gemini معادل حدود 4 کاراکتر است. 100 توکن حدود 60-80 کلمه انگلیسی است.

[**] RPM: درخواست در دقیقه
TPM: توکن در دقیقه
RPD: درخواست در روز
TPD: توکن در روز

به دلیل محدودیت ظرفیت، حداکثر نرخ تعیین شده تضمین نمی شود.

الگوهای نام نسخه مدل

مدل‌های Gemini در نسخه‌های پیش‌نمایش یا پایدار موجود هستند. در کد خود می توانید از یکی از فرمت های نام مدل زیر استفاده کنید تا مشخص کنید از کدام مدل و نسخه می خواهید استفاده کنید.

  • آخرین: به نسخه پیشرفته مدل برای یک نسل و تنوع مشخص اشاره می کند. مدل اصلی به طور منظم به روز می شود و ممکن است یک نسخه پیش نمایش باشد. فقط برنامه های آزمایش اکتشافی و نمونه های اولیه باید از این نام مستعار استفاده کنند.

    برای تعیین آخرین نسخه، از الگوی زیر استفاده کنید: <model>-<generation>-<variation>-latest . به عنوان مثال، gemini-1.0-pro-latest .

  • آخرین نسخه پایدار: به آخرین نسخه پایدار منتشر شده برای نسل و تنوع مدل مشخص شده اشاره می کند.

    برای تعیین آخرین نسخه پایدار، از الگوی زیر استفاده کنید: <model>-<generation>-<variation> . به عنوان مثال، gemini-1.0-pro .

  • پایدار: به یک مدل پایدار خاص اشاره می کند. مدل های پایدار تغییر نمی کنند. اکثر برنامه های تولیدی باید از یک مدل پایدار خاص استفاده کنند.

    برای تعیین یک نسخه پایدار، از الگوی زیر استفاده کنید: <model>-<generation>-<variation>-<version> . به عنوان مثال، gemini-1.0-pro-001 .

  • آزمایشی: به یک مدل آزمایشی موجود در Preview اشاره می کند، همانطور که در شرایط تعریف شده است، به این معنی که برای استفاده تولیدی نیست. ما مدل‌های آزمایشی را منتشر می‌کنیم تا بازخورد جمع‌آوری کنیم، آخرین به‌روزرسانی‌های خود را به سرعت در اختیار توسعه‌دهندگان قرار دهیم، و سرعت نوآوری‌هایی که در Google اتفاق می‌افتد را برجسته کنیم. آنچه از راه‌اندازی‌های آزمایشی می‌آموزیم نشان می‌دهد که چگونه مدل‌ها را به طور گسترده‌تری عرضه می‌کنیم. یک مدل آزمایشی را می توان بدون اطلاع قبلی با مدل دیگری تعویض کرد. ما تضمین نمی کنیم که یک مدل آزمایشی در آینده به یک مدل پایدار تبدیل شود.

    برای تعیین یک نسخه آزمایشی، از الگوی زیر استفاده کنید: <model>-<generation>-<variation>-<version> . به عنوان مثال، gemini-exp-1121 .

زبان های موجود

مدل های Gemini برای کار با زبان های زیر آموزش دیده اند:

  • عربی ( ar )
  • بنگالی ( bn )
  • بلغاری ( bg )
  • چینی ساده و سنتی ( zh )
  • کرواتی ( hr )
  • چک ( cs )
  • دانمارکی ( da )
  • هلندی ( nl )
  • انگلیسی ( en )
  • استونیایی ( et )
  • فنلاندی ( fi )
  • فرانسوی ( fr )
  • آلمانی ( de )
  • یونانی ( el )
  • عبری ( iw )
  • هندی ( hi )
  • مجارستانی ( hu )
  • اندونزیایی ( id )
  • ایتالیایی ( it )
  • ژاپنی ( ja )
  • کره ای ( ko )
  • لتونی ( lv )
  • لیتوانیایی ( lt )
  • نروژی ( no )
  • لهستانی ( pl )
  • پرتغالی ( pt )
  • رومانیایی ( ro )
  • روسی ( ru )
  • صربی ( sr )
  • اسلواکی ( sk )
  • اسلوونیایی ( sl )
  • اسپانیایی ( es )
  • سواحیلی ( sw )
  • سوئدی ( sv )
  • تایلندی ( th )
  • ترکی ( tr )
  • اوکراینی ( uk )
  • ویتنامی ( vi )