פלטפורמת Google Cloud מספקת הרבה אפשרויות לפריסה, להצגה ולכוונון של מודלים פתוחים של Gemma 4, כולל:
- Vertex AI Model Garden
- Cloud Run
- Google Kubernetes Engine (GKE)
- ערכת פיתוח של סוכנים (ADK)
- Vertex AI Training Clusters (VTC)
- MaxText
- vLLM עם מעבדי TPU
- Sovereign Cloud
Vertex AI Model Garden
Vertex AI היא פלטפורמת Google Cloud לפיתוח מהיר של פרויקטים של למידת מכונה ולהתאמה שלהם לעומס (scaling). Gemma 4 זמין ב-Model Garden, אוסף של מודלים שנבחרו בקפידה ב-Vertex AI. אתם יכולים לבדוק ולפרוס מודלים ישירות מהמסוף.
מידע נוסף זמין בדפים הבאים:
- מבוא ל-Vertex AI: תחילת העבודה עם Vertex AI.
- Gemma עם Vertex AI: שימוש במודלים פתוחים של Gemma עם Vertex AI.
Cloud Run
Cloud Run היא פלטפורמה מנוהלת לחלוטין להרצת קוד או קונטיינרים על גבי התשתית של Google, שניתנת להתאמה רחבה. פריסת Gemma 4 ב-Cloud Run באמצעות יחידות GPU להסקת מסקנות בשיטת צמצום הפעולה לאפס ותשלום לפי שימוש.
למודלים גדולים יותר, אפשר להשתמש בהגדרות מתקדמות עם יחידות GPU מסוג RTX 6000 Pro והזרמת מודלים.
Google Kubernetes Engine (GKE)
Google Kubernetes Engine (GKE) הוא שירות Kubernetes מנוהל מ-Google Cloud. הפעלת Gemma 4 ב-GKE לתזמור קונטיינרים ברמה שמתאימה לארגונים. שימוש ביחידות TPU ו-GPU להצגת מודלים עם תפוקה גבוהה וזמן אחזור נמוך.
ערכה לפיתוח סוכנים (ADK)
יצירה של סוכני AI וניהול שלהם באמצעות Gemma 4 והערכה לפיתוח סוכנים (ADK). יכולות החשיבה הרציונלית והפונקציות של Gemma 4 הופכות אותו לאידיאלי לתהליכי עבודה סוכניים.
קלאסטרים לאימון ב-Vertex AI (VTC)
איך מבצעים התאמה עדינה של Gemma 4 באמצעות Vertex AI Training Clusters (VTC) התכונה 'צפייה בהמרות' מספקת תשתית אופטימלית לאימון ולכוונון עדין של מודלים פתוחים בקנה מידה גדול.
vLLM עם מעבדי TPU
הפעלת Gemma 4 ב-TPU של Google Cloud לביצועים מתקדמים של הפעלת מודלים.
MaxText
Gemma 4 נתמך ב-MaxText, הטמעה של מודל שפה גדול (LLM) ב-JAX בגודל שרירותי עם ביצועים גבוהים, לשימוש ב-TPU של Google Cloud.
Sovereign Cloud
Gemma 4 זמין בפתרונות Sovereign Cloud, ומספק שליטה ותאימות משופרות לעומסי עבודה רגישים.