برای نمونه‌های تولید و تنظیم، مخزن کتاب آشپزی Gemma را بررسی کنید! بیشتر بدانید

این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.

تنظیم دقیق مدل جما، تنظیم دقیق مدل جما، تنظیم دقیق مدل جما، تنظیم دقیق مدل جما

تنظیم دقیق یک مدل هوش مصنوعی مولد (AI) مانند Gemma رفتار مدل را اصلاح می کند. شما معمولاً Gemma را با هدف بهبود عملکرد آن در یک کار یا دامنه خاص یا برای ایفای بهتر نقشی مانند خدمات مشتری تنظیم می کنید. مدل‌های جما با وزن‌های باز منتشر می‌شوند، به این معنی که می‌توانید آن وزن‌ها را تغییر دهید، که سپس رفتار مدل را تغییر می‌دهد. مراحل کلی برای تنظیم دقیق مدل Gemma به شرح زیر است:

چارچوبی را انتخاب کنید
داده ها را جمع آوری کنید
مدل را تنظیم و تست کنید
مدل را مستقر کنید

چارچوبی را انتخاب کنید

مدل‌های Gemma با انواع چارچوب‌های تنظیم هوش مصنوعی سازگار هستند. هر فریم ورک مزایای مختلفی را ارائه می دهد و معمولاً به یک قالب مدل خاص محدود می شود. در اینجا راهنمای تنظیم مدل های Gemma با فریمورک های مختلف وجود دارد:

Keras با استفاده از LoRA
کتابخانه Gemma برای JAX
صورت در آغوش گرفته
Google Cloud GKE (چند GPU با HF Transformers)
تنبلی
Axolotl
Keras با استفاده از تنظیم توزیع شده

مطمئن شوید که قالب مدل استقرار مورد نظر شما، مانند قالب Keras، Safetensors، یا GGUF، به عنوان یک خروجی توسط چارچوب انتخابی شما پشتیبانی می شود.

داده ها را جمع آوری کنید

تنظیم مدل به داده نیاز دارد. داده های تنظیم معمولاً از جفت داده های ورودی با پاسخ مورد انتظار تشکیل شده است. مجموعه داده های عمومی زیادی به صورت آنلاین برای آموزش وظایف یا خروجی های مختلف موجود است. برای مثال، اگر می‌خواهید یک مدل Gemma را برای ترجمه توضیحات قطعات خودرو به شماره قطعات آموزش دهید، مجموعه داده‌های شما ممکن است شامل موارد زیر باشد:

training_data = [
  {"input_text": "Part number for A4 brake caliper", "output_text": "4M0615107BS"},
  {"input_text": "Part number for Beetle fuel pump", "output_text": "6A127026H"},
  {"input_text": "Part number for Camaro cylinder head", "output_text": "12711770"},
]

اگر می‌خواهید یک مدل Gemma مجموعه‌ای از وظایف یا نقش‌های خاصی را انجام دهد، معمولاً باید مجموعه داده‌ای را جمع‌آوری کنید که تغییرات متعدد آن کار را نشان دهد. اینکه چه مقدار داده برای تنظیم یک مدل نیاز دارید، به اهداف شما بستگی دارد، به ویژه اینکه چقدر تغییر رفتاری از مدل می‌خواهید و چقدر می‌خواهید مدل بر اساس وظیفه‌ای که باید انجام شود و سطح تغییرات در داده‌های ورودی، چقدر خوب عمل کند.

به طور کلی، شما باید با مجموعه کوچکی از داده‌ها برای تنظیم وظایف خود شروع کنید، پارامترهای آموزشی را تنظیم کنید، و داده‌ها را تا زمانی که به عملکردی که نیاز شما را برآورده می‌کند، اضافه کنید. برخی از برنامه‌های کاربردی مثال ما نشان می‌دهند که می‌توانید رفتار یک مدل Gemma را با حداقل 20 جفت اعلان و پاسخ تحت تأثیر قرار دهید. برای جزئیات بیشتر، به ساخت دستیار هوش مصنوعی ایمیل تجاری با Gemma و Tasks به زبان های گفتاری با Gemma مراجعه کنید.

مدل را تنظیم و تست کنید

هنگامی که یک چارچوب تنظیم و تنظیم داده ها در محل خود دارید، می توانید فرآیند تنظیم مدل Gemma را شروع کنید. هنگام اجرای کوک، گزینه هایی در نحوه تنظیم دارید که بر منابع مورد نیاز برای تکمیل آن تأثیر می گذارد. شما همچنین باید یک برنامه آزمایشی برای مدل تنظیم شده خود داشته باشید تا ارزیابی کنید که آیا پس از تنظیم به همان شکلی که می خواهید عمل می کند یا خیر.

تنظیم کارآمد از نظر پارامتر

هنگام تنظیم دقیق یک مدل وزن باز مانند Gemma، شما این امکان را دارید که تمام پارامترهای مدل را تنظیم کنید یا از تکنیک تنظیم کارآمد پارامتر با منابع کمتر استفاده کنید که زیر مجموعه ای از آنها را به روز می کند. یک رویکرد تنظیم کامل به این معنی است که با اعمال داده های تنظیم خود، وزن های جدید را برای تمام پارامترهای مدل محاسبه می کنید. این روش محاسبات فشرده و حافظه فشرده است، زیرا شما این محاسبات را برای میلیاردها پارامتر انجام می دهید. استفاده از روش‌های تنظیم با منابع کمتر، به نام تنظیم دقیق کارآمد پارامتر (PEFT) ، از جمله تکنیک‌هایی مانند تنظیم آداپتور کم رتبه (LoRA) می‌تواند نتایج مشابهی را با منابع محاسباتی کمتر تولید کند. برای جزئیات در مورد نحوه انجام تنظیم با منابع کمتر با استفاده از LoRA، به تنظیم دقیق مدل‌های Gemma در Keras با استفاده از LoRA و مدل‌های تنظیم دقیق Gemma در Hugging Face مراجعه کنید.

تست مدل های تنظیم شده

هنگامی که یک مدل را برای یک کار خاص تنظیم کردید، باید عملکرد آن را در برابر مجموعه کارهایی که می خواهید انجام دهد، آزمایش کنید. شما باید مدل خود را با وظایف یا درخواست هایی آزمایش کنید که به طور خاص در مورد آنها آموزش ندیده است. نحوه آزمایش مدل تنظیم شده خود به وظیفه ای که می خواهید انجام دهد و نحوه مدیریت ورودی ها و خروجی های مدل بستگی دارد. یک راه متداول برای مدیریت آزمایش مدل مولد استفاده از موارد موفقیت، شکست و مرزی است:

تست های موفقیت : درخواست می کند که مدل تنظیم شده همیشه بتواند با موفقیت انجام شود.
تست‌های شکست : درخواست می‌کند که مدل تنظیم‌شده همیشه قادر به انجام آن نباشد، یا در صورت درخواست به صراحت از انجام آن امتناع کند.
تست های مرزی : درخواست می کند که مدل تنظیم شده باید بتواند انجام دهد، در صورتی که در یک مرز تعریف شده یا مجموعه ای از مرزهای رفتار خروجی قابل قبول قرار می گیرند.

هنگام آزمایش شکست یا شرایط مرزی برای برنامه هوش مصنوعی مولد خود، باید روش‌ها، تکنیک‌ها و ابزارهای ایمنی مولد هوش مصنوعی را همانطور که در جعبه ابزار هوش مصنوعی مولد پاسخگو توضیح داده شده است، اعمال کنید.

مدل را مستقر کنید

پس از تکمیل تنظیم و تکمیل موفقیت آمیز آزمایش، نوبت به استقرار مدل می رسد. برای نحوه استقرار یک مدل تنظیم شده معمولاً می توانید به اسناد چارچوب انتخابی خود مراجعه کنید.

اگر مدلی را با وزنه‌های تنظیم‌شده LoRA اجرا می‌کنید، توجه داشته باشید که با این تکنیک معمولاً هم مدل اصلی و هم وزن‌های آن را با وزن‌های LoRA به‌عنوان یک لایه محاسبه اضافی برای مدل به کار می‌گیرید.

چارچوبی را انتخاب کنید
داده ها را جمع آوری کنید
مدل را تنظیم و تست کنید
مدل را مستقر کنید

چارچوبی را انتخاب کنید

Keras با استفاده از LoRA
کتابخانه Gemma برای JAX
صورت در آغوش گرفته
Google Cloud GKE (چند GPU با HF Transformers)
تنبل
Axolotl
Keras با استفاده از تنظیم توزیع شده

داده ها را جمع آوری کنید

training_data = [
  {"input_text": "Part number for A4 brake caliper", "output_text": "4M0615107BS"},
  {"input_text": "Part number for Beetle fuel pump", "output_text": "6A127026H"},
  {"input_text": "Part number for Camaro cylinder head", "output_text": "12711770"},
]

مدل را تنظیم و تست کنید

تنظیم کارآمد از نظر پارامتر

تست مدل های تنظیم شده

تست های موفقیت : درخواست می کند که مدل تنظیم شده همیشه بتواند با موفقیت انجام شود.
تست‌های شکست : درخواست می‌کند که مدل تنظیم‌شده همیشه قادر به انجام آن نباشد، یا در صورت درخواست به صراحت از انجام آن امتناع کند.
تست های مرزی : درخواست می کند که مدل تنظیم شده باید بتواند انجام دهد، در صورتی که در یک مرز تعریف شده یا مجموعه ای از مرزهای رفتار خروجی قابل قبول قرار می گیرند.

چارچوبی را انتخاب کنید

Keras با استفاده از LoRA
کتابخانه Gemma برای JAX
صورت در آغوش گرفته
Google Cloud GKE (چند GPU با HF Transformers)
تنبل
Axolotl
Keras با استفاده از تنظیم توزیع شده

داده ها را جمع آوری کنید

training_data = [
  {"input_text": "Part number for A4 brake caliper", "output_text": "4M0615107BS"},
  {"input_text": "Part number for Beetle fuel pump", "output_text": "6A127026H"},
  {"input_text": "Part number for Camaro cylinder head", "output_text": "12711770"},
]

مدل را تنظیم و تست کنید

تنظیم کارآمد از نظر پارامتر

تست مدل های تنظیم شده

تست های موفقیت : درخواست می کند که مدل تنظیم شده همیشه بتواند با موفقیت انجام شود.
تست‌های شکست : درخواست می‌کند که مدل تنظیم‌شده همیشه قادر به انجام آن نباشد، یا در صورت درخواست به صراحت از انجام آن امتناع کند.
تست های مرزی : درخواست می کند که مدل تنظیم شده باید بتواند انجام دهد، در صورتی که در یک مرز تعریف شده یا مجموعه ای از مرزهای رفتار خروجی قابل قبول قرار می گیرند.

مدل را مستقر کنید

چارچوبی را انتخاب کنید
داده ها را جمع آوری کنید
مدل را تنظیم و تست کنید
مدل را مستقر کنید

چارچوبی را انتخاب کنید

Keras با استفاده از LoRA
کتابخانه Gemma برای JAX
صورت در آغوش گرفته
Google Cloud GKE (چند GPU با HF Transformers)
تنبل
Axolotl
Keras با استفاده از تنظیم توزیع شده

داده ها را جمع آوری کنید

training_data = [
  {"input_text": "Part number for A4 brake caliper", "output_text": "4M0615107BS"},
  {"input_text": "Part number for Beetle fuel pump", "output_text": "6A127026H"},
  {"input_text": "Part number for Camaro cylinder head", "output_text": "12711770"},
]

مدل را تنظیم و تست کنید

تنظیم کارآمد از نظر پارامتر

تست مدل های تنظیم شده

تست های موفقیت : درخواست می کند که مدل تنظیم شده همیشه بتواند با موفقیت انجام شود.
تست‌های شکست : درخواست می‌کند که مدل تنظیم‌شده همیشه قادر به انجام آن نباشد، یا در صورت درخواست به صراحت از انجام آن امتناع کند.
تست های مرزی : درخواست می کند که مدل تنظیم شده باید بتواند انجام دهد، در صورتی که در یک مرز تعریف شده یا مجموعه ای از مرزهای رفتار خروجی قابل قبول قرار می گیرند.