1.5
فلاشمتعادل ترین مدل چندوجهی ما با عملکرد عالی برای اکثر وظایف
- صدا، تصاویر، ویدئو و متن را وارد کنید، پاسخ های متنی را دریافت کنید
- کد تولید کنید، داده ها را استخراج کنید، متن را ویرایش کنید و موارد دیگر
- بهترین برای وظایف متعادل کننده عملکرد و هزینه
انواع مدل
Gemini API مدل های مختلفی را ارائه می دهد که برای موارد استفاده خاص بهینه شده اند. در اینجا یک مرور مختصر از انواع Gemini موجود است:
نوع مدل | ورودی(های) | خروجی | بهینه شده برای |
---|---|---|---|
فلش جمینی 1.5gemini-1.5-flash | صدا، تصاویر، ویدئوها و متن | متن | عملکرد سریع و همه کاره در انواع مختلف وظایف |
Gemini 1.5 Flash-8Bgemini-1.5-flash-8b | صدا، تصاویر، ویدئوها و متن | متن | وظایف با حجم بالا و هوش کمتر |
جمینی 1.5 پروgemini-1.5-pro | صدا، تصاویر، ویدئوها و متن | متن | وظایف استدلالی پیچیده که به هوش بیشتری نیاز دارد |
Gemini 1.0 Pro (منسوخ شده در 2025/2/15)gemini-1.0-pro | متن | متن | وظایف زبان طبیعی، چت متنی و کد چند نوبتی، و تولید کد |
جاسازی متنtext-embedding-004 | متن | جاسازی متن | اندازه گیری ارتباط رشته های متنی |
AQAaqa | متن | متن | ارائه پاسخ های مبتنی بر منبع به سوالات |
فلش جمینی 1.5
Gemini 1.5 Flash یک مدل چندوجهی سریع و همه کاره برای مقیاسبندی وظایف مختلف است.
جزئیات مدل
اموال | توضیحات |
---|---|
کد مدل | models/gemini-1.5-flash |
انواع داده های پشتیبانی شده | ورودی ها صدا، تصویر، ویدئو و متن خروجی متن |
[*] | محدودیت های رمزمحدودیت رمز ورودی 1,048,576 محدودیت نشانه خروجی 8,192 |
مشخصات صوتی/بصری | حداکثر تعداد تصاویر در هر درخواست 3600 حداکثر طول ویدیو 1 ساعت حداکثر طول صدا تقریبا 9.5 ساعت |
محدودیتهای نرخ [**] |
|
قابلیت های | دستورالعمل های سیستم پشتیبانی می شود حالت JSON پشتیبانی می شود طرحواره JSON پشتیبانی می شود تنظیمات ایمنی قابل تنظیم پشتیبانی می شود ذخیره سازی پشتیبانی می شود تنظیم پشتیبانی می شود فراخوانی تابع پشتیبانی می شود اجرای کد پشتیبانی می شود |
نسخه |
|
آخرین به روز رسانی | سپتامبر 2024 |
Gemini 1.5 Flash-8B
Gemini 1.5 Flash-8B یک مدل کوچک است که برای کارهای با هوش کمتر طراحی شده است.
جزئیات مدل
اموال | توضیحات |
---|---|
کد مدل | models/gemini-1.5-flash-8b |
انواع داده های پشتیبانی شده | ورودی ها صدا، تصویر، ویدئو و متن خروجی متن |
[*] | محدودیت های رمزمحدودیت رمز ورودی 1,048,576 محدودیت نشانه خروجی 8,192 |
مشخصات صوتی/بصری | حداکثر تعداد تصاویر در هر درخواست 3600 حداکثر طول ویدیو 1 ساعت حداکثر طول صدا تقریبا 9.5 ساعت |
محدودیتهای نرخ [**] |
|
قابلیت های | دستورالعمل های سیستم پشتیبانی می شود حالت JSON پشتیبانی می شود طرحواره JSON پشتیبانی می شود تنظیمات ایمنی قابل تنظیم پشتیبانی می شود ذخیره سازی پشتیبانی می شود تنظیم پشتیبانی می شود فراخوانی تابع پشتیبانی می شود اجرای کد پشتیبانی می شود |
نسخه |
|
آخرین به روز رسانی | اکتبر 2024 |
جمینی 1.5 پرو
Gemini 1.5 Pro یک مدل چندوجهی با اندازه متوسط است که برای طیف وسیعی از وظایف استدلالی بهینه شده است. 1.5 Pro می تواند حجم زیادی از داده ها را همزمان پردازش کند، از جمله 2 ساعت ویدیو، 19 ساعت صدا، پایگاه های کد با 60000 خط کد یا 2000 صفحه متن.
جزئیات مدل
اموال | توضیحات |
---|---|
کد مدل | models/gemini-1.5-pro |
انواع داده های پشتیبانی شده | ورودی ها صدا، تصویر، ویدئو و متن خروجی متن |
[*] | محدودیت های رمزمحدودیت رمز ورودی 2,097,152 محدودیت نشانه خروجی 8,192 |
مشخصات صوتی/بصری | حداکثر تعداد تصاویر در هر درخواست 7200 حداکثر طول ویدیو 2 ساعت حداکثر طول صدا تقریبا 19 ساعت |
محدودیتهای نرخ [**] |
|
قابلیت های | دستورالعمل های سیستم پشتیبانی می شود حالت JSON پشتیبانی می شود طرحواره JSON پشتیبانی می شود تنظیمات ایمنی قابل تنظیم پشتیبانی می شود ذخیره سازی پشتیبانی می شود تنظیم پشتیبانی نمی شود فراخوانی تابع پشتیبانی می شود اجرای کد پشتیبانی می شود |
نسخه |
|
آخرین به روز رسانی | سپتامبر 2024 |
Gemini 1.0 Pro (منسوخ شده)
Gemini 1.0 Pro یک مدل NLP است که وظایفی مانند چت متنی و کد چند نوبتی و تولید کد را انجام می دهد.
جزئیات مدل
اموال | توضیحات |
---|---|
کد مدل | models/gemini-1.0-pro |
انواع داده های پشتیبانی شده | ورودی متن خروجی متن |
محدودیتهای نرخ [**] |
|
قابلیت های | دستورالعمل های سیستم پشتیبانی نمی شود حالت JSON پشتیبانی نمی شود طرحواره JSON پشتیبانی نمی شود تنظیمات ایمنی قابل تنظیم پشتیبانی می شود ذخیره سازی پشتیبانی نمی شود تنظیم پشتیبانی می شود فراخوانی تابع پشتیبانی می شود پیکربندی فراخوانی تابع پشتیبانی نمی شود اجرای کد پشتیبانی نمی شود |
نسخه |
|
آخرین به روز رسانی | فوریه 2024 |
جاسازی و جاسازی متن
جاسازی متن
جاسازی متن برای اندازه گیری ارتباط رشته ها استفاده می شود و به طور گسترده در بسیاری از برنامه های کاربردی هوش مصنوعی استفاده می شود.
text-embedding-004
عملکرد بازیابی قویتری را به دست میآورد و از مدلهای موجود با ابعاد قابل مقایسه در معیارهای استاندارد تعبیهسازی MTEB بهتر عمل میکند .
جزئیات مدل
اموال | توضیحات |
---|---|
کد مدل | Gemini API |
انواع داده های پشتیبانی شده | ورودی متن خروجی جاسازی متن |
[*] | محدودیت های رمزمحدودیت رمز ورودی 2,048 اندازه ابعاد خروجی 768 |
محدودیتهای نرخ [**] | 1500 درخواست در دقیقه |
تنظیمات امنیتی قابل تنظیم | پشتیبانی نمی شود |
آخرین به روز رسانی | آوریل 2024 |
جاسازی
می توانید از مدل Embedding برای ایجاد جاسازی متن برای متن ورودی استفاده کنید.
مدل Embedding برای ایجاد جاسازی با 768 بعد برای متن تا 2048 توکن بهینه شده است.
تعبیه جزئیات مدل
اموال | توضیحات |
---|---|
کد مدل | models/embedding-001 |
انواع داده های پشتیبانی شده | ورودی متن خروجی جاسازی متن |
[*] | محدودیت های رمزمحدودیت رمز ورودی 2,048 اندازه ابعاد خروجی 768 |
محدودیتهای نرخ [**] | 1500 درخواست در دقیقه |
تنظیمات امنیتی قابل تنظیم | پشتیبانی نمی شود |
آخرین به روز رسانی | دسامبر 2023 |
AQA
می توانید از مدل AQA برای انجام وظایف مرتبط با پرسش و پاسخ نسبت داده شده (AQA) در یک سند، مجموعه یا مجموعه ای از متن ها استفاده کنید. مدل AQA به سوالاتی که در منابع ارائه شده پایه گذاری شده اند، به همراه تخمین احتمال پاسخگو پاسخ می دهد.
جزئیات مدل
اموال | توضیحات |
---|---|
کد مدل | models/aqa |
انواع داده های پشتیبانی شده | ورودی متن خروجی متن |
پشتیبانی شده | انگلیسی |
[*] | محدودیت های رمزمحدودیت رمز ورودی 7,168 محدودیت نشانه خروجی 1024 |
محدودیتهای نرخ [**] | 1500 درخواست در دقیقه |
تنظیمات امنیتی قابل تنظیم | پشتیبانی می شود |
آخرین به روز رسانی | دسامبر 2023 |
برای کشف قابلیتهای این مدلها به مثالها مراجعه کنید.
[*] یک نشانه برای مدل های Gemini معادل حدود 4 کاراکتر است. 100 توکن حدود 60-80 کلمه انگلیسی است.
[**] RPM: درخواست در دقیقه
TPM: توکن در دقیقه
RPD: درخواست در روز
TPD: توکن در روز
به دلیل محدودیت ظرفیت، حداکثر نرخ تعیین شده تضمین نمی شود.
الگوهای نام نسخه مدل
مدلهای Gemini در نسخههای پیشنمایش یا پایدار موجود هستند. در کد خود می توانید از یکی از فرمت های نام مدل زیر استفاده کنید تا مشخص کنید از کدام مدل و نسخه می خواهید استفاده کنید.
آخرین: به نسخه پیشرفته مدل برای یک نسل و تنوع مشخص اشاره می کند. مدل اصلی به طور منظم به روز می شود و ممکن است یک نسخه پیش نمایش باشد. فقط برنامه های آزمایش اکتشافی و نمونه های اولیه باید از این نام مستعار استفاده کنند.
برای تعیین آخرین نسخه، از الگوی زیر استفاده کنید:
<model>-<generation>-<variation>-latest
. به عنوان مثال،gemini-1.0-pro-latest
.آخرین نسخه پایدار: به آخرین نسخه پایدار منتشر شده برای نسل و تنوع مدل مشخص شده اشاره می کند.
برای تعیین آخرین نسخه پایدار، از الگوی زیر استفاده کنید:
<model>-<generation>-<variation>
. به عنوان مثال،gemini-1.0-pro
.پایدار: به یک مدل پایدار خاص اشاره می کند. مدل های پایدار تغییر نمی کنند. اکثر برنامه های تولیدی باید از یک مدل پایدار خاص استفاده کنند.
برای تعیین یک نسخه پایدار، از الگوی زیر استفاده کنید:
<model>-<generation>-<variation>-<version>
. به عنوان مثال،gemini-1.0-pro-001
.آزمایشی: به یک مدل آزمایشی موجود در Preview اشاره می کند، همانطور که در شرایط تعریف شده است، به این معنی که برای استفاده تولیدی نیست. ما مدلهای آزمایشی را منتشر میکنیم تا بازخورد جمعآوری کنیم، آخرین بهروزرسانیهای خود را به سرعت در اختیار توسعهدهندگان قرار دهیم، و سرعت نوآوریهایی که در Google اتفاق میافتد را برجسته کنیم. آنچه از راهاندازیهای آزمایشی میآموزیم نشان میدهد که چگونه مدلها را به طور گستردهتری عرضه میکنیم. یک مدل آزمایشی را می توان بدون اطلاع قبلی با مدل دیگری تعویض کرد. ما تضمین نمی کنیم که یک مدل آزمایشی در آینده به یک مدل پایدار تبدیل شود.
برای تعیین یک نسخه آزمایشی، از الگوی زیر استفاده کنید:
<model>-<generation>-<variation>-<version>
. به عنوان مثال،gemini-exp-1121
.
زبان های موجود
مدل های Gemini برای کار با زبان های زیر آموزش دیده اند:
- عربی (
ar
) - بنگالی (
bn
) - بلغاری (
bg
) - چینی ساده و سنتی (
zh
) - کرواتی (
hr
) - چک (
cs
) - دانمارکی (
da
) - هلندی (
nl
) - انگلیسی (
en
) - استونیایی (
et
) - فنلاندی (
fi
) - فرانسوی (
fr
) - آلمانی (
de
) - یونانی (
el
) - عبری (
iw
) - هندی (
hi
) - مجارستانی (
hu
) - اندونزیایی (
id
) - ایتالیایی (
it
) - ژاپنی (
ja
) - کره ای (
ko
) - لتونی (
lv
) - لیتوانیایی (
lt
) - نروژی (
no
) - لهستانی (
pl
) - پرتغالی (
pt
) - رومانیایی (
ro
) - روسی (
ru
) - صربی (
sr
) - اسلواکی (
sk
) - اسلوونیایی (
sl
) - اسپانیایی (
es
) - سواحیلی (
sw
) - سوئدی (
sv
) - تایلندی (
th
) - ترکی (
tr
) - اوکراینی (
uk
) - ویتنامی (
vi
)