تشغيل ميزة إنشاء المحتوى والاستنتاجات في Gemma

هناك قراران رئيسيان يجب اتخاذهما عند تشغيل نموذج Gemma: 1) نوع Gemma الذي تريد تشغيله، و2) إطار عمل تنفيذ الذكاء الاصطناعي الذي ستستخدمه لتشغيله. ترتبط إحدى القضايا الرئيسية في اتخاذ هذين القرارَين بأنواع الأجهزة المتوفّرة لك وللمستخدمين لتشغيل النموذج.

تساعدك هذه النظرة العامة في التعرّف على هذه القرارات والبدء في العمل مع نماذج Gemma. في ما يلي الخطوات العامة لتشغيل نموذج Gemma:

اختيار إطار عمل

تتوافق نماذج Gemma مع مجموعة متنوعة من منصّات تنفيذ الذكاء الاصطناعي التوليدي. أحد العوامل الرئيسية لاتخاذ القرار في تشغيل نموذج Gemma هو موارد الحوسبة المتاحة لك (أو التي ستتوفّر لك) لتشغيل النموذج. تتطلّب معظم إطارات عمل الذكاء الاصطناعي المتوافقة أجهزة مخصّصة، مثل وحدات GPU أو TPU، لتشغيل نموذج Gemma بفعالية. يمكن أن توفّر أدوات مثل Google Colab موارد الحوسبة المتخصصة هذه على أساس محدود. تتيح لك بعض أُطر تنفيذ الذكاء الاصطناعي، مثل Ollama و Gemma.cpp، تشغيل Gemma على وحدات المعالجة المركزية الأكثر شيوعًا باستخدام معماريات متوافقة مع x86 أو ARM.

في ما يلي أدلة لتشغيل نماذج Gemma باستخدام أطر عمل مختلفة لوقت تشغيل الذكاء الاصطناعي:

تأكَّد من أنّ إطار العمل الذي اخترته متوافق مع تنسيق نموذج Gemma المخصّص للنشر، مثل تنسيق Keras الأصلي أو Safetensors أو GGUF.

اختيار أحد أنواع Gemma

تتوفّر نماذج Gemma بعدة أشكال وأحجام، بما في ذلك نماذج Gemma الأساسية أو الأساسية، ونماذج أكثر تخصصًا، مثل PaliGemma و DataGemma، والعديد من النماذج التي أنشأها مجتمع مطوّري الذكاء الاصطناعي على مواقع إلكترونية مثل Kaggle و Hugging Face. إذا لم تكن متأكّدًا من الصيغة التي يجب البدء بها، اختَر أحدث نموذج تعليمات مُعدّ (IT) لـ Gemma الأساسية مع أدنى عدد من المَعلمات. يتطلب هذا النوع من نماذج Gemma متطلبات حوسبة منخفضة، ويمكنه الردّ على مجموعة كبيرة من الطلبات بدون الحاجة إلى تطوير إضافي.

ضَع العوامل التالية في الاعتبار عند اختيار أحد الأسعار المتغيرة لتطبيق Gemma:

  • Gemma core وعائلات الصيغ الأخرى، مثل PaliGemma وCodeGemma: ننصح باستخدام Gemma (الأساسية). تشترك صيغ Gemma في بنية الإصدار الأساسي، وهي مُدرَّبة لتحقيق أداء أفضل في مهام معيّنة. ما لم يكن تطبيقك أو أهدافك متوافقة مع التخصص في أحد أنواع Gemma، من الأفضل البدء بطراز Gemma أساسي أو أساسي.
  • النموذج المُعدّل وفقًا للتعليمات (IT) والنموذج المدّرب مسبقًا (PT) والنموذج المُعدّل بدقة (FT) والنموذج المختلط (mix): ننصح باستخدام النموذج المُعدّل وفقًا للتعليمات.
    • نماذج Gemma المحسَّنة بالتعليمات (IT) هي نماذج تم تدريبها للردّ على مجموعة متنوعة من التعليمات أو الطلبات باللغة البشرية. تشكّل صيغ النماذج هذه أفضل مكان للبدء، لأنّها يمكنها الردّ على الطلبات بدون تدريب إضافي على النموذج.
    • نُسخ Gemma المدربة مسبقًا هي نماذج تم تدريبها على إجراء استنتاجات حول اللغة أو بيانات أخرى، ولكن لم يتم تدريبها على اتّباع تعليمات البشر. تتطلّب هذه النماذج تدريبًا إضافيًا أو تعديلًا لتتمكّن من تنفيذ المهام بفعالية، وهي مخصّصة للباحثين أو المطوّرين الذين يريدون دراسة قدرات النموذج أو تطويرها وهندسته.
    • يمكن اعتبار صيغ Gemma المحسّنة (FT) صِيَغًا لتكنولوجيا المعلومات، ولكن يتم تدريبها عادةً لتنفيذ مهمة معيّنة أو تحقيق أداء جيد في اختبار أداء محدّد للذكاء الاصطناعي التوليدي. تتضمّن عائلة الصيغ PaliGemma عددًا من الصيغ FT.
    • نُسخ Gemma المختلطة (mix) هي إصدارات من نماذج PaliGemma التي تم تحسينها باستخدام مجموعة متنوعة من التعليمات وهي مناسبة للاستخدام العام.
  • Parameters: اقتراح أصغر عدد متاح بشكل عام، كلما زاد عدد المَعلمات في النموذج، زادت كفاءته. ومع ذلك، يتطلّب تشغيل نماذج أكبر موارد حوسبة أكبر وأكثر تعقيدًا، ويؤدي بشكل عام إلى إبطاء تطوير تطبيق الذكاء الاصطناعي. ما لم تكن قد اتّخذت قرارًا بأنّ نموذج Gemma الأصغر حجمًا لا يمكنه تلبية احتياجاتك، اختَر نموذجًا يتضمّن عددًا قليلاً من المَعلمات.
  • مستويات الترميز: ننصح باستخدام الدقة النصف (16 بت)، باستثناء التحسين. التخزين الكمي هو موضوع معقّد يتلخّص في حجم البيانات ودقتها، وبالتالي مقدار الذاكرة التي يستخدمها نموذج الذكاء الاصطناعي التوليدي لإجراء العمليات الحسابية وإنشاء الردود. بعد تدريب نموذج باستخدام بيانات عالية الدقة، والتي تكون عادةً بيانات بنقطة عائمة 32 بت، يمكن تعديل نماذج مثل Gemma لاستخدام بيانات بدقة أقل، مثل أحجام 16 أو 8 أو 4 بت. يمكن أن تحقّق نماذج Gemma المقيَّدة هذه أداءً جيدًا، استنادًا إلى تعقيد المهام، مع استخدام موارد معالجة وذاكرة أقل بكثير. ومع ذلك، فإنّ أدوات ضبط النماذج المحوَّلة إلى أرقام ثنائية محدودة وقد لا تكون متاحة ضمن إطار عمل تطوير الذكاء الاصطناعي الذي اخترته. عادةً ما يكون عليك تحسين نموذج مثل "جيما" بدقة كاملة، ثم تحويل النموذج الناتج إلى عدد صحيح.

للحصول على قائمة بالنماذج الرئيسية التي نشرتها Google من Gemma، يُرجى الاطّلاع على مقالة بدء استخدام نماذج Gemma، قائمة نماذج Gemma.

تنفيذ طلبات إنشاء النماذج واستنتاج النتائج

بعد اختيار إطار عمل تنفيذ الذكاء الاصطناعي ونسخة من Gemma، يمكنك بدء تشغيل النموذج وطلب إنشاء محتوى أو إكمال المهام. لمزيد من المعلومات عن كيفية تشغيل Gemma باستخدام إطار عمل معيّن، اطّلِع على الأدلة المرتبطة في قسم اختيار إطار عمل.

تنسيق الطلب

تفرض جميع صيغ Gemma المخصّصة للتعليمات متطلبات محددة لتنسيق الطلبات. يعالج إطار العمل الذي تستخدمه لتشغيل نماذج Gemma تلقائيًا بعض متطلبات التنسيق هذه، ولكن عند إرسال بيانات الطلب مباشرةً إلى أداة تقسيم الكلمات، عليك إضافة علامات محدّدة، ويمكن أن تتغيّر متطلبات وضع العلامات استنادًا إلى نوع Gemma الذي تستخدمه. اطّلِع على الادّلّة التالية للحصول على معلومات عن تنسيق طلبات Gemma المتعدّدة وتعليمات النظام: