مدل های جوزا

Gemini خانواده ای از مدل های هوش مصنوعی مولد است که به توسعه دهندگان اجازه می دهد محتوا تولید کنند و مشکلات را حل کنند. این مدل‌ها طوری طراحی و آموزش دیده‌اند که هم متن و هم عکس را به عنوان ورودی مدیریت کنند. این راهنما اطلاعاتی در مورد هر مدل ارائه می دهد تا به شما کمک کند تصمیم بگیرید که کدام یک برای مورد استفاده شما مناسب است.

در اینجا خلاصه ای کوتاه از مدل های موجود و قابلیت های آنها آورده شده است:

مدل ها ورودی خروجی
جوزا
  • Gemini 1.5 Pro (فقط پیش نمایش)
متن و تصاویر متن
  • Gemini 1.0 Pro
متن متن
  • Gemini 1.0 Pro Vision
متن و تصاویر متن
جاسازی ها
  • جاسازی
متن جاسازی متن
بازیابی
  • AQA
متن متن

ایمنی و استفاده مورد نظر

مدل‌های هوش مصنوعی مولد ابزارهای قدرتمندی هستند، اما بدون محدودیت نیستند. تطبیق پذیری و کاربرد آنها گاهی اوقات می تواند منجر به خروجی های غیرمنتظره شود، مانند خروجی هایی که نادرست، جانبدارانه یا توهین آمیز هستند. ارزیابی دستی پس از پردازش و دقیق برای محدود کردن خطر آسیب ناشی از چنین خروجی‌هایی ضروری است. برای پیشنهادات استفاده ایمن بیشتر به راهنمای ایمنی مراجعه کنید.

مدل‌های ارائه شده توسط Gemini API می‌توانند برای طیف گسترده‌ای از برنامه‌های کاربردی هوش مصنوعی و پردازش زبان طبیعی (NLP) استفاده شوند. استفاده از این توابع فقط از طریق Gemini API یا برنامه وب Google AI Studio در دسترس است. استفاده شما از Gemini API نیز مشمول خط مشی استفاده ممنوعه از هوش مصنوعی مولد و شرایط خدمات Gemini API است.

اندازه های مدل

جدول زیر اندازه های موجود و معنای آنها را نسبت به یکدیگر نشان می دهد.

اندازه مدل شرح خدمات
Gemini 1.0 Pro اندازه مدلی که توانایی و کارایی را متعادل می کند.
  • متن
  • چت کردن

نسخه های مدل

مدل‌های Gemini در نسخه‌های پیش‌نمایش یا پایدار موجود هستند. در کد خود می توانید از یکی از فرمت های نام مدل زیر استفاده کنید تا مشخص کنید از کدام مدل و نسخه می خواهید استفاده کنید.

  • آخرین: به نسخه پیشرفته مدل برای یک نسل و تنوع مشخص اشاره می کند. مدل اصلی به طور منظم به روز می شود و ممکن است یک نسخه پیش نمایش باشد. فقط برنامه های آزمایش اکتشافی و نمونه های اولیه باید از این نام مستعار استفاده کنند.

    برای تعیین آخرین نسخه، از الگوی زیر استفاده کنید: <model>-<generation>-<variation>-latest . به عنوان مثال، gemini-1.0-pro-latest .

  • آخرین نسخه پایدار: به آخرین نسخه پایدار منتشر شده برای نسل و تنوع مدل مشخص شده اشاره می کند.

    برای تعیین آخرین نسخه پایدار، از الگوی زیر استفاده کنید: <model>-<generation>-<variation> . به عنوان مثال، gemini-1.0-pro .

  • پایدار: به یک مدل پایدار خاص اشاره می کند. مدل های پایدار تغییر نمی کنند. اکثر برنامه های تولیدی باید از یک مدل پایدار خاص استفاده کنند.

    برای تعیین یک نسخه پایدار، از الگوی زیر استفاده کنید: <model>-<generation>-<variation>-<version> . به عنوان مثال، gemini-1.0-pro-001 .

برای مدل‌هایی که نسخه پایدار دارند، به ردیف «نام‌های مدل» مدل در Varations Model مراجعه کنید.

تغییرات مدل

Gemini API مدل های مختلفی را ارائه می دهد که برای موارد استفاده خاص بهینه شده اند. جدول زیر ویژگی های هر یک را توضیح می دهد.

تغییر صفت شرح
Gemini 1.5 Pro (فقط پیش نمایش) آخرین آپدیت مدل آوریل 2024
کد مدل models/gemini-1.5-pro-latest
قابلیت های مدل
  • ورودی: صدا، تصویر، متن
  • خروجی: متن
  • بهینه شده برای کارهای زبانی مانند:
    • تولید کد
    • تولید متن
    • ویرایش متن
    • حل مسئله
    • تولید توصیه ها
    • استخراج اطلاعات
    • استخراج یا تولید داده ها
    • عامل هوش مصنوعی
  • می تواند وظایف صفر، یک و چند ضربه ای را انجام دهد.
روش های تولید پشتیبانی شده generateContent
محدودیت رمز ورودی 1048576
محدودیت نشانه خروجی 8192
ایمنی مدل تنظیمات ایمنی به صورت خودکار اعمال می شود که توسط توسعه دهندگان قابل تنظیم است. برای جزئیات به موضوع تنظیمات ایمنی مراجعه کنید.
حد نرخ 2 پرس و جو در دقیقه، 1000 پرس و جو در روز [1]
جمینی پرو آخرین آپدیت مدل فوریه 2024
کد مدل models/gemini-pro
قابلیت های مدل
  • متن ورودی
  • خروجی: متن
  • متن تولید می کند.
  • می تواند فرمت مکالمه چند نوبتی را مدیریت کند.
  • می تواند وظایف صفر، یک و چند ضربه ای را انجام دهد.
روش های تولید پشتیبانی شده generateContent
محدودیت رمز ورودی 30720
محدودیت نشانه خروجی 2048
ایمنی مدل تنظیمات ایمنی به صورت خودکار اعمال می شود که توسط توسعه دهندگان قابل تنظیم است. برای جزئیات به مبحث تنظیمات ایمنی مراجعه کنید.
حد نرخ 60 درخواست در دقیقه [1]
نام مدل ها
  • آخرین نسخه: gemini-1.0-pro-latest
  • آخرین نسخه پایدار: gemini-1.0-pro
  • نسخه های پایدار:
    • gemini-1.0-pro-001
Gemini 1.0 Pro Vision آخرین آپدیت مدل دسامبر 2023
کد مدل models/gemini-pro-vision
قابلیت های مدل
  • ورودی: متن و عکس
  • خروجی: متن
  • می تواند ورودی های چندوجهی، متن و تصویر بگیرد.
  • می تواند وظایف صفر، یک و چند ضربه ای را انجام دهد.
روش های تولید پشتیبانی شده generateContent
محدودیت رمز ورودی 12288
محدودیت نشانه خروجی 4096
ایمنی مدل تنظیمات ایمنی به صورت خودکار اعمال می شود که توسط توسعه دهندگان قابل تنظیم است. برای جزئیات به موضوع تنظیمات ایمنی مراجعه کنید.
حد نرخ 60 درخواست در دقیقه [1]
جاسازی آخرین به روز رسانی مدل دسامبر 2023
کد مدل models/embedding-001
قابلیت های مدل
  • متن ورودی
  • خروجی: متن
  • جاسازی های متنی را برای متن ورودی ایجاد می کند.
  • برای ایجاد جاسازی برای متن تا 2048 توکن بهینه شده است.
روش های تولید پشتیبانی شده embedContent
ایمنی مدل بدون تنظیمات ایمنی قابل تنظیم
حد نرخ 1500 درخواست در دقیقه [1]
جاسازی متن آخرین به روز رسانی مدل آوریل 2024
کد مدل models/text-embedding-004 ( text-embedding-preview-0409 in Vertex AI )
قابلیت های مدل
  • متن ورودی
  • خروجی: متن
  • جاسازی های متنی را برای متن ورودی ایجاد می کند.
  • سایزهای جاسازی الاستیک زیر 768 را پشتیبانی می کند.
روش های تولید پشتیبانی شده embedContent
ایمنی مدل بدون تنظیمات ایمنی قابل تنظیم
حد نرخ 1500 درخواست در دقیقه [1]
AQA آخرین آپدیت مدل دسامبر 2023
کد مدل models/aqa
قابلیت های مدل
  • متن ورودی
  • خروجی: متن
  • مدلی که پاسخ‌دهی به سؤال را انجام می‌دهد.
  • مدل آموزش داده شده برای بازگرداندن پاسخ به سوالاتی که در منابع ارائه شده، همراه با تخمین احتمال پاسخگو هستند.
روش های تولید پشتیبانی شده generateAnswer
زبان های پشتیبانی شده انگلیسی
محدودیت رمز ورودی 7168
محدودیت نشانه خروجی 1024
ایمنی مدل تنظیمات ایمنی به صورت خودکار اعمال می شود که توسط توسعه دهندگان قابل تنظیم است. برای جزئیات به موضوع تنظیمات ایمنی مراجعه کنید.
حد نرخ 60 درخواست در دقیقه [1]

برای کشف قابلیت‌های این مدل‌ها به مثال‌ها مراجعه کنید.

فراداده مدل

از ModelService API برای دریافت فراداده های اضافی درباره آخرین مدل ها مانند محدودیت های رمز ورودی و خروجی استفاده کنید. جدول زیر متادیتای مدل Gemini Pro را نشان می دهد.

صفت ارزش
نام نمایشی Gemini 1.0 Pro
کد مدل models/gemini-1.0-pro
شرح مدل هدفمند برای تولید متن
روش های تولید پشتیبانی شده generateContent
درجه حرارت 0.9
top_p 1
top_k 1

ویژگی های مدل

جدول زیر ویژگی‌های مدل‌های جمینی را که در همه تغییرات مدل مشترک است، توضیح می‌دهد.

صفت شرح
داده های آموزشی سطح دانش Gemini در اوایل سال 2023 است. دانش درباره رویدادهای پس از آن زمان محدود است.
زبان های پشتیبانی شده زبان های موجود را ببینید
پارامترهای مدل قابل تنظیم
  • صفحه بالا
  • بالا k
  • درجه حرارت
  • توالی توقف
  • حداکثر طول خروجی
  • تعداد نامزدهای پاسخگو

[1] با توجه به محدودیت ظرفیت، حداکثر نرخ تعیین شده تضمین نمی شود.

برای اطلاعات در مورد هر یک از این پارامترها به بخش پارامترهای مدل در راهنمای مقدمه LLMs مراجعه کنید.

مراحل بعدی