نمای کلی مدل Gemma 3

جما یک خانواده از مدل‌های هوش مصنوعی مولد (AI) است و شما می‌توانید از آن‌ها در طیف گسترده‌ای از وظایف تولید، از جمله پاسخ‌گویی به سؤال، خلاصه‌سازی و استدلال استفاده کنید. مدل‌های Gemma با وزنه‌های باز ارائه می‌شوند و اجازه استفاده تجاری مسئولانه را می‌دهند و به شما این امکان را می‌دهند که آنها را در پروژه‌ها و برنامه‌های خود تنظیم و به کار ببرید.

نسخه Gemma 3 شامل ویژگی های کلیدی زیر است. آن را در AI Studio امتحان کنید:

می توانید مدل های جما 3 را از Kaggle و Hugging Face دانلود کنید. برای جزئیات فنی بیشتر در مورد Gemma 3، کارت مدل و گزارش فنی را ببینید. نسخه های قبلی مدل های هسته جما نیز برای دانلود در دسترس هستند. برای اطلاعات بیشتر، مدل های قبلی Gemma را ببینید.

Gemma 3 را امتحان کنید Get it on Kaggle Get it on Hugging Face

ورودی تصویر و متن چند وجهی

می‌توانید با Gemma 3 با توانایی مدیریت داده‌های تصویر و متن، به تجزیه و تحلیل پیچیده‌تر و وظایف تولید بپردازید. شما می توانید از این مدل برای تفسیر داده های تصویر، شناسایی اشیا، استخراج داده های متنی و تکمیل بسیاری از کارهای ورودی بصری به خروجی متن استفاده کنید. شروع به ساختن کنید

پنجره زمینه 128K نشانه

مدل‌های Gemma 3 می‌توانند ورودی‌های فوری تا 128 هزار توکن را مدیریت کنند که یک پنجره زمینه 16 برابر بزرگتر از مدل‌های قبلی Gemma است. تعداد زیاد نشانه ها به این معنی است که می توانید چندین مقاله چند صفحه ای، مقاله تکی بزرگتر یا صدها تصویر را در یک درخواست پردازش کنید.

پشتیبانی از زبان گسترده

با پشتیبانی داخلی بیش از 140 زبان به زبان خود کار کنید. Gemma 3 برای پشتیبانی از تعداد زیادی زبان در مقایسه با نسخه‌های قبلی Gemma آموزش دیده است و به شما امکان می‌دهد کارهای بصری و متنی بیشتری را در زبان‌هایی که مشتریانتان استفاده می‌کنند انجام دهید. شروع به ساختن کنید

اندازه پارامترها و کوانتیزاسیون

مدل های Gemma 3 در 4 اندازه پارامتر در 5 سطح دقت، از دقت کامل در 32 بیت تا کمترین دقت در 4 بیت در دسترس هستند. اندازه ها و دقت های مختلف مجموعه ای از معاوضه ها را برای برنامه هوش مصنوعی شما نشان می دهد. مدل‌هایی با پارامترها و تعداد بیت‌های بالاتر (دقت بالاتر) معمولاً توانمندتر هستند، اما از نظر چرخه‌های پردازش، هزینه حافظه و مصرف انرژی، گران‌تر هستند. مدل هایی با پارامترها و تعداد بیت کمتر (دقت کمتر) قابلیت های کمتری دارند، اما ممکن است برای وظیفه هوش مصنوعی شما کافی باشند. جدول زیر جزئیات مورد نیاز تقریبی حافظه GPU یا TPU برای اجرای استنتاج با هر اندازه از نسخه های مدل Gemma 3 را نشان می دهد.

پارامترها 32 بیت کامل BF16 (16 بیت) SFP8
(8 بیتی)
Q4_0
(4 بیتی)
INT4
(4 بیتی)
Gemma 3 1B ( فقط متن ) 4 گیگابایت 1.5 گیگابایت 1.1 گیگابایت 892 مگابایت 861 مگابایت
Gemma 3 4B 16 گیگابایت 6.4 گیگابایت 4.4 گیگابایت 3.4 گیگابایت 3.2 گیگابایت
Gemma 3 12B 48 گیگابایت 20 گیگابایت 12.2 گیگابایت 8.7 گیگابایت 8.2 گیگابایت
Gemma 3 27B 108 گیگابایت 46.4 گیگابایت 29.1 گیگابایت 21 گیگابایت 19.9 گیگابایت

جدول 1. حافظه تقریبی GPU یا TPU مورد نیاز برای بارگیری مدل های Gemma 3 بر اساس تعداد پارامترها و سطح کوانتیزاسیون (عمق بیت).

مصرف حافظه بر اساس تعداد کل توکن های مورد نیاز برای درخواستی که اجرا می کنید افزایش می یابد. هر چه تعداد نشانه های مورد نیاز برای پردازش درخواست شما بیشتر باشد، حافظه مورد نیاز بیشتر است، که علاوه بر حافظه مورد نیاز برای بارگذاری مدل است.

مدل های قبلی جما

می‌توانید با نسل‌های قبلی مدل‌های Gemma که از Kaggle و Hugging Face نیز موجود است، کار کنید. برای جزئیات فنی بیشتر در مورد مدل های قبلی Gemma، به صفحات کارت مدل زیر مراجعه کنید:

برای شروع ساختن آماده اید؟ با مدل های Gemma شروع کنید !