פלטפורמת Google Cloud מספקת הרבה אפשרויות לפריסה, להצגה ולכוונון עדין של מודלים פתוחים של Gemma 4, כולל:
- Gemini Enterprise Agent Platform
- Cloud Run
- Google Kubernetes Engine (GKE)
- ערכת פיתוח של סוכנים (ADK)
- Gemini Enterprise Agent Platform Training Clusters
- MaxText
- vLLM עם מעבדי TPU
- Sovereign Cloud
פלטפורמת הסוכנים של Gemini Enterprise
Gemini Enterprise Agent Platform היא פלטפורמה של Google Cloud שמאפשרת לבנות ולהרחיב במהירות פרויקטים של למידת מכונה. Gemma 4 זמין ב-Model Garden, אוסף של מודלים שנבחרו בקפידה ב-Gemini Enterprise Agent Platform. אפשר לבדוק ולפרוס מודלים ישירות מהמסוף.
מידע נוסף זמין בדפים הבאים:
- סקירה כללית של Agent Platform: איך מתחילים להשתמש ב-Gemini Enterprise Agent Platform.
- Gemma עם Gemini Enterprise Agent Platform: אפשר להשתמש במודלים פתוחים של Gemma עם Gemini Enterprise Agent Platform.
Cloud Run
Cloud Run היא פלטפורמה מנוהלת לחלוטין להרצת קוד או קונטיינרים על גבי התשתית של Google, שאפשר להתאים לעומס. פריסת Gemma 4 ב-Cloud Run באמצעות יחידות GPU להסקת מסקנות עם תשלום לפי שימוש ושינוי קנה מידה לאפס.
לגודלי מודלים גדולים יותר, אפשר להשתמש בהגדרות מתקדמות עם מעבדי RTX 6000 Pro גרפיים והזרמת מודלים.
Google Kubernetes Engine (GKE)
Google Kubernetes Engine (GKE) הוא שירות Kubernetes מנוהל מבית Google Cloud. הפעלת Gemma 4 ב-GKE לתזמור קונטיינרים ברמה שמתאימה לארגונים. שימוש ביחידות TPU ו-GPU להצגת מודלים עם תפוקה גבוהה וזמן אחזור נמוך.
ערכה לפיתוח סוכנים (ADK)
פיתוח וניהול של סוכני AI באמצעות Gemma 4 ו-Agent Development Kit (ADK). יכולות ההסקה והפעלת הפונקציות החזקות של Gemma 4 הופכות אותו לאידיאלי לתהליכי עבודה של סוכני AI.
Gemini Enterprise Agent Platform Training Clusters
איך מבצעים התאמה עדינה של Gemma 4 באמצעות Gemini Enterprise Agent Platform Training Clusters Training Clusters מספקת תשתית שעברה אופטימיזציה לאימון ולשיפור של מודלים פתוחים בקנה מידה גדול.
vLLM עם מעבדי TPU
מילו בקשות של Gemma 4 ב-Google Cloud TPUs כדי לקבל את ביצועי המילו הטובים ביותר.
MaxText
Gemma 4 נתמך ב-MaxText, הטמעה של JAX LLM בגודל שרירותי עם ביצועים גבוהים עבור TPU ב-Google Cloud.
Sovereign Cloud
Gemma 4 זמין בפתרונות Sovereign Cloud, ומספק בקרה ותאימות משופרות לעומסי עבודה רגישים.