تحسين نموذج Gemma

يؤدي تحسين نموذج الذكاء الاصطناعي التوليدي، مثل Gemma، إلى تعديل سلوك النموذج. عادةً ما يتم تحسين Gemma بهدف تحسين أدائها في مهمة أو نطاق معيّنَين، أو بهدف تأدية دور معيّن بشكل أفضل، مثل خدمة العملاء. يتم إصدار نماذج Gemma مع ملف ملف مفتوح للمَعلمات، ما يعني أنّه يمكنك تعديل هذه المَعلمات، ما يؤدي بدوره إلى تغيير سلوك النموذج. في ما يلي الخطوات العامة لتحسين نموذج Gemma:

اختيار إطار عمل

تتوافق نماذج Gemma مع مجموعة متنوعة من أُطر عمل ضبط الذكاء الاصطناعي. يقدّم كل إطار عمل مزايا مختلفة، ويكون عادةً مقيّدًا بتنسيق نموذج معيّن. في ما يلي أدلة لضبط نماذج Gemma باستخدام إطارات عمل مختلفة:

تأكَّد من أنّ إطار العمل الذي اخترته يتيح استخدام تنسيق نموذج النشر المقصود، مثل تنسيق Keras أو Safetensors أو GGUF، كإخراج.

جمع البيانات

يتطلّب ضبط النموذج بيانات. تتألف بيانات الضبط عادةً من أزواج من بيانات الإدخال مع الاستجابة المتوقّعة. تتوفّر العديد من مجموعات البيانات المتاحة للجميع على الإنترنت للتدريب على مهام أو نتائج مختلفة. على سبيل المثال، إذا أردت تدريب ملف شخصي على Gemma لترجمة أوصاف قطع غيار السيارات إلى أرقام القطع، قد تتضمّن مجموعة بياناتك ما يلي:

training_data = [
  {"input_text": "Part number for A4 brake caliper", "output_text": "4M0615107BS"},
  {"input_text": "Part number for Beetle fuel pump", "output_text": "6A127026H"},
  {"input_text": "Part number for Camaro cylinder head", "output_text": "12711770"},
]

إذا أردت من نموذج Gemma تنفيذ مجموعة معيّنة من المهام أو الأدوار، تحتاج عادةً إلى تجميع مجموعة بيانات تعرض صيغًا متعدّدة من تلك المهام. يعتمد مقدار البيانات التي تحتاجها لضبط نموذج على أهدافك، لا سيما مقدار التغيير السلوكي الذي تريده من النموذج ومدى جودة أداء النموذج استنادًا إلى المهمة التي تريد إنجازها ومستوى التفاوت في بيانات الإدخال.

بشكل عام، عليك البدء بمجموعة صغيرة من البيانات لضبط المهمة، وتعديل مَعلمات التدريب، وإضافة البيانات إلى أن تحقّق أداء المهمة الذي يلبي احتياجاتك. توضّح بعض أمثلة التطبيقات أنّه يمكنك التأثير في سلوك نموذج Gemma باستخدام 20 مثيلًا كحدّ أدنى من أزواج الطلبات والردّ. لمزيد من التفاصيل، يُرجى الاطّلاع على مقالتَي إنشاء مساعد مستند إلى الذكاء الاصطناعي للبريد الإلكتروني للأنشطة التجارية باستخدام Gemma ومهام باللغة المنطوقة باستخدام Gemma.

ضبط النموذج واختباره

بعد وضع إطار عمل للضبط وبيانات الضبط، يمكنك بدء عملية ضبط نموذج Gemma. عند إجراء عملية الضبط، تتوفّر لك بعض الخيارات في كيفية إجراء الضبط، ما يؤثر في الموارد التي تحتاجها لإكمالها. يجب أيضًا أن يكون لديك خطة اختبار للنموذج الذي تم ضبطه لتقييم ما إذا كان يؤدي الأداء الذي تريده بعد الضبط.

ضبط مُفعّل للمَعلمات

عند تحسين نموذج أوزان مفتوح مثل Gemma، يتوفّر لك خيار تعديل كل المَعلمات في النموذج أو استخدام أسلوب تعديل فعّال للمَعلمات الأقل استهلاكًا للموارد، والذي يعدّل مجموعة فرعية منها. تعني منهج الضبط الكامل أنّه عند تطبيق بيانات الضبط، يتم احتساب معاملات ترجيح جديدة لجميع مَعلمات النموذج. يتطلّب هذا النهج معالجة مكثفة للبيانات واستخدامًا مكثّفًا للذاكرة، لأنّك تُجري هذه العمليات الحسابية لمليارات المَعلمات. باستخدام أساليب ضبط أقل استهلاكًا للموارد، والتي تُعرف باسم الضبط الدقيق الفعال للمَعلمات (PEFT)، بما في ذلك تقنيات مثل ضبط محوِّل الترتيب المنخفض (LoRA)، يمكن تحقيق نتائج مشابهة باستخدام موارد حسابية أقل. للاطّلاع على تفاصيل حول كيفية إجراء عملية التحسين باستخدام موارد أقل باستخدام LoRA، يُرجى الاطّلاع على مقالتَي تحسين نماذج Gemma في Keras باستخدام LoRA وتحسين نماذج Gemma في Hugging Face.

اختبار النماذج المحسّنة

بعد ضبط نموذج لمهمة معيّنة، عليك اختبار أدائه مقارنةً بمجموعة المهام التي تريده تنفيذها. يجب اختبار النموذج باستخدام مهام أو طلبات لم يتم تدريبه عليها تحديدًا. تعتمد طريقة اختبار النموذج الذي تم تعديله على المهمة التي تريده تنفيذها ومدى دقة إدارة المدخلات والمخرجات للنموذج. من الطرق الشائعة لإدارة اختبار نماذج الإنشاء هي استخدام حالات النجاح والفشل والحالات الحدية:

  • اختبارات النجاح: طلبات بأن يكون النموذج المحسَّن قادرًا دائمًا على الأداء بنجاح
  • اختبارات الفشل: طلبات بأنّه يجب ألا يكون النموذج المحسَّن دائمًا قادرًا على الأداء، أو أنّه يرفض صراحةً الأداء إذا طُلب منه ذلك
  • اختبارات الحدود: طلبات يجب أن يكون بإمكان النموذج المحسّن تنفيذها، إذا كانت تندرج ضمن حدود محدّدة أو مجموعة من الحدود لسلوك الإخراج المقبول.

عند اختبار حالات الفشل أو الحدود لتطبيق الذكاء الاصطناعي التوليدي، يجب أيضًا تطبيق أساليب وتقنيات وأدوات أمان الذكاء الاصطناعي التوليدي كما هو описан في مجموعة أدوات الذكاء الاصطناعي التوليدي المسؤول.

نشر النموذج

بعد إكمال عملية الضبط وإكمال الاختبار بنجاح، حان الوقت لنشر النموذج. يمكنك عادةً الرجوع إلى مستندات الإطار العمل الذي اخترته لمعرفة كيفية نشر نموذج معدَّل.

إذا كنت بصدد نشر نموذج باستخدام أوزان معدَّلة لبروتوكول LoRA، يُرجى العِلم أنّه باستخدام هذه الطريقة، يتم عادةً نشر كلّ من النموذج الأصلي وأوزانه باستخدام أوزان LoRA كطبقة حسابية إضافية للنموذج.