تؤدي عملية الضبط الدقيق لنموذج ذكاء اصطناعي توليدي، مثل Gemma، إلى تعديل سلوك النموذج. عادةً ما يتم ضبط Gemma بدقة بهدف تحسين أدائها في مهمة أو مجال معيّن، أو لتنفيذ دور معيّن بشكل أفضل، مثل خدمة العملاء. يتم إصدار نماذج Gemma مع أوزان مفتوحة، ما يعني أنّه يمكنك تعديل هذه الأوزان، ما يؤدي إلى تغيير سلوك النموذج. في ما يلي الخطوات العامة لضبط نموذج Gemma بدقة:
اختيار إطار عمل
تتوافق نماذج Gemma مع مجموعة متنوعة من أُطر ضبط الذكاء الاصطناعي. يقدّم كل إطار عمل مزايا مختلفة، وعادةً ما يكون مقصورًا على تنسيق نموذج معيّن. في ما يلي أدلة لضبط نماذج Gemma باستخدام أُطر عمل مختلفة:
- Keras باستخدام LoRA
- مكتبة Gemma لـ JAX
- Hugging Face
- Google Cloud GKE (وحدات معالجة الرسومات المتعددة مع HF Transformers)
- Google Cloud Vertex AI
- Unsloth
- Axolotl
- Keras باستخدام ميزة "الضبط الموزّع"
تأكَّد من أنّ تنسيق نموذج النشر المطلوب، مثل تنسيق Keras أو Safetensors أو GGUF، متوافق مع الإطار الذي اخترته كناتج.
جمع البيانات
يتطلّب ضبط النموذج توفّر بيانات. تتألف بيانات الضبط عادةً من أزواج من بيانات الإدخال مع الرد المتوقّع. تتوفّر العديد من مجموعات البيانات العامة على الإنترنت للتدريب على مهام أو نتائج مختلفة. على سبيل المثال، إذا أردت تدريب نموذج Gemma لترجمة أوصاف قطع غيار السيارات إلى أرقام قطع الغيار، قد تتضمّن مجموعة البيانات ما يلي:
training_data = [
{"input_text": "Part number for A4 brake caliper", "output_text": "4M0615107BS"},
{"input_text": "Part number for Beetle fuel pump", "output_text": "6A127026H"},
{"input_text": "Part number for Camaro cylinder head", "output_text": "12711770"},
]
إذا أردت أن ينفّذ نموذج Gemma مجموعة محدّدة من المهام أو الأدوار، عليك عادةً تجميع مجموعة بيانات تعرض عدة أشكال مختلفة من تلك المهمة. يعتمد مقدار البيانات التي تحتاج إليها لضبط النموذج على أهدافك، خاصةً مقدار التغيير السلوكي الذي تريده من النموذج ومدى جودة أداء النموذج استنادًا إلى المهمة المطلوب إنجازها ومستوى التباين في بيانات الإدخال.
بشكل عام، يجب البدء بمجموعة صغيرة من البيانات لضبط مهمتك، وتعديل مَعلمات التدريب، وإضافة البيانات إلى أن تحقّق أداء المهمة الذي يلبي احتياجاتك. توضّح بعض الأمثلة على التطبيقات أنّه يمكنك التأثير في سلوك نموذج Gemma باستخدام 20 زوجًا فقط من الطلبات والردود. لمزيد من التفاصيل، يُرجى الاطّلاع على إنشاء مساعد مستند إلى الذكاء الاصطناعي للبريد الإلكتروني الخاص بالنشاط التجاري باستخدام Gemma و إنجاز المهام بلغات محكية باستخدام Gemma.
ضبط النموذج واختباره
بعد توفّر إطار عمل للضبط وبيانات الضبط، يمكنك البدء في عملية ضبط نموذج Gemma. عند إجراء عملية الضبط، تتوفّر لك بعض الخيارات بشأن كيفية ضبط الأداء، ما يؤثر في الموارد التي تحتاج إليها لإكمال العملية. يجب أن تتضمّن خطتك أيضًا اختبارًا للنموذج المعدَّل لتقييم ما إذا كان يؤدي الغرض المطلوب بعد التعديل.
الضبط الفعّال من حيث المعلَمات
عند إجراء عملية الضبط الدقيق لنموذج مفتوح الأوزان مثل Gemma، يمكنك ضبط جميع المَعلمات في النموذج أو استخدام تقنية ضبط فعّالة للمَعلمات تتطلّب موارد أقل وتعدّل مجموعة فرعية من المَعلمات. يعني اتّباع أسلوب التعديل الكامل أنّه عند تطبيق بيانات التعديل، عليك احتساب معاملات ترجيح جديدة لجميع مَعلمات النموذج. هذه الطريقة تتطلّب قدرًا كبيرًا من الحوسبة والذاكرة، لأنّك تجري هذه العمليات الحسابية لمليارات المَعلمات. يمكن أن يؤدي استخدام أساليب ضبط أقل استهلاكًا للموارد، تُعرف باسم الضبط الدقيق الفعّال للمعلمات (PEFT)، بما في ذلك تقنيات مثل ضبط Low Rank Adapter (LoRA)، إلى تحقيق نتائج مماثلة باستخدام موارد حوسبة أقل. للحصول على تفاصيل حول كيفية إجراء عملية الضبط باستخدام موارد أقل باستخدام LoRA، يُرجى الاطّلاع على الضبط الدقيق لنماذج Gemma في Keras باستخدام LoRA والضبط الدقيق لنماذج Gemma في Hugging Face.
اختبار النماذج المعدَّلة
بعد ضبط نموذج لمهمة معيّنة، عليك اختبار أدائه مقارنةً بمجموعة المهام التي تريد أن ينفّذها. يجب اختبار النموذج باستخدام مهام أو طلبات لم يتم تدريبه عليها بشكل خاص. تعتمد طريقة اختبار النموذج المعدَّل على المهمة التي تريد أن ينفّذها ومدى تحكّمك في البيانات التي يتم إدخالها إلى النموذج والنتائج التي يقدمها. من الطرق الشائعة لإدارة اختبار النماذج التوليدية استخدام حالات النجاح والفشل والحالات الحدّية:
- اختبارات النجاح: الطلبات التي يجب أن يتمكّن النموذج المضبوط من تنفيذها بنجاح دائمًا.
- اختبارات الفشل: هي طلبات يجب أن يرفض النموذج المعدَّل تنفيذها دائمًا، أو يرفضها بشكل صريح عند الطلب.
- اختبارات الحدود: هي طلبات يجب أن يتمكّن النموذج المضبوط من تنفيذها إذا كانت تندرج ضمن حدود أو مجموعة حدود محدّدة لسلوك الإخراج المقبول.
عند اختبار حالات الأعطال أو الحالات الحدّية لتطبيق الذكاء الاصطناعي التوليدي، عليك أيضًا تطبيق أساليب وتقنيات وأدوات أمان الذكاء الاصطناعي التوليدي كما هو موضّح في مجموعة أدوات الذكاء الاصطناعي التوليدي المتجاوب مع مختلف الأجهزة.
نشر النموذج
بعد الانتهاء من عملية الضبط وإكمال الاختبار بنجاح، حان الوقت لنشر النموذج. يمكنك عادةً الرجوع إلى المستندات الخاصة بالإطار الذي اخترته لمعرفة كيفية نشر نموذج معدَّل.
إذا كنت بصدد نشر نموذج يتضمّن أوزانًا معدَّلة باستخدام LoRA، يُرجى العِلم أنّه باستخدام هذه التقنية، يمكنك عادةً نشر كل من النموذج الأصلي وأوزانه مع أوزان LoRA كطبقة حسابية إضافية للنموذج.