نشر Gemma باستخدام Google Cloud

توفّر منصة Google Cloud العديد من الخيارات لنشر نماذج Gemma 4 المفتوحة وتشغيلها وضبطها، بما في ذلك ما يلي:

منصة وكيل Gemini Enterprise

Gemini Enterprise Agent Platform هي منصة من Google Cloud تتيح إنشاء مشاريع تعلُّم الآلة وتوسيع نطاقها بسرعة. يتوفّر نموذج Gemma 4 في Model Garden، وهي مجموعة منظَّمة من النماذج على Gemini Enterprise Agent Platform. يمكنك اختبار النماذج ونشرها مباشرةً من وحدة التحكّم.

لمزيد من المعلومات، يُرجى الرجوع إلى الصفحات التالية:

Cloud Run

Cloud Run هي منصة مُدارة بالكامل لتشغيل الرموز البرمجية أو الحاويات على بنية Google التحتية القابلة للتوسّع بدرجة كبيرة. يمكنك نشر Gemma 4 على Cloud Run باستخدام وحدات معالجة الرسومات للتوسّع إلى صفر، والدفع حسب الاستخدام للاستنتاج.

بالنسبة إلى أحجام النماذج الأكبر، يمكنك الاستفادة من الإعدادات المتقدّمة باستخدام وحدات معالجة الرسومات RTX 6000 Pro وبث النماذج.

Google Kubernetes Engine (GKE)

Google Kubernetes Engine (GKE) هي خدمة Kubernetes مُدارة من Google Cloud. يمكنك تشغيل Gemma 4 على GKE لتنسيق الحاويات على مستوى المؤسسة. استخدِم وحدات معالجة الموتّرات ووحدات معالجة الرسومات لتشغيل النماذج بمعدّل نقل بيانات عالٍ ووقت استجابة منخفض.

حزمة تطوير الوكلاء (ADK)

يمكنك إنشاء وكلاء الذكاء الاصطناعي وتنسيقهم باستخدام Gemma 4 وحزمة تطوير الوكلاء (ADK). تُعدّ إمكانات الاستنتاج القوية وإمكانات استدعاء الدوال في Gemma 4 مثالية لسير العمل المستند إلى الذكاء الاصطناعي الوكيل.

مجموعات تدريب منصة وكيل Gemini Enterprise

يمكنك ضبط Gemma 4 باستخدام مجموعات تدريب منصة وكيل Gemini Enterprise الخاصة بـ. توفّر مجموعات التدريب بنية تحتية محسّنة للتدريب على نطاق واسع وضبط النماذج المفتوحة.

vLLM مع وحدات معالجة الموتّرات

يمكنك تشغيل Gemma 4 على وحدات معالجة الموتّرات في Google Cloud للحصول على أداء تشغيل متطوّر.

MaxText

يتوافق Gemma 4 مع MaxText، وهو تنفيذ عالي الأداء للنماذج اللغوية الكبيرة (LLM) المستندة إلى JAX بأحجام عشوائية لوحدات معالجة الموتّرات في Google Cloud.

Sovereign Cloud

يتوفّر Gemma 4 على حلول Sovereign Cloud، ما يوفّر تحكّمًا وامتثالاً محسّنَين لأحمال العمل الحسّاسة.