פריסת Gemma באמצעות Google Cloud

פלטפורמת Google Cloud מספקת הרבה אפשרויות לפריסה, להצגה ולכוונון עדין של מודלים פתוחים של Gemma 4, כולל:

פלטפורמת הסוכנים של Gemini Enterprise

Gemini Enterprise Agent Platform היא פלטפורמה של Google Cloud שמאפשרת לבנות ולהרחיב במהירות פרויקטים של למידת מכונה. ‫Gemma 4 זמין ב-Model Garden, אוסף של מודלים שנבחרו בקפידה ב-Gemini Enterprise Agent Platform. אפשר לבדוק ולפרוס מודלים ישירות מהמסוף.

מידע נוסף זמין בדפים הבאים:

Cloud Run

Cloud Run היא פלטפורמה מנוהלת לחלוטין להרצת קוד או קונטיינרים על גבי התשתית של Google, שאפשר להתאים לעומס. פריסת Gemma 4 ב-Cloud Run באמצעות יחידות GPU להסקת מסקנות עם תשלום לפי שימוש ושינוי קנה מידה לאפס.

לגודלי מודלים גדולים יותר, אפשר להשתמש בהגדרות מתקדמות עם מעבדי RTX 6000 Pro גרפיים והזרמת מודלים.

Google Kubernetes Engine (‏GKE)

Google Kubernetes Engine‏ (GKE) הוא שירות Kubernetes מנוהל מבית Google Cloud. הפעלת Gemma 4 ב-GKE לתזמור קונטיינרים ברמה שמתאימה לארגונים. שימוש ביחידות TPU ו-GPU להצגת מודלים עם תפוקה גבוהה וזמן אחזור נמוך.

ערכה לפיתוח סוכנים (ADK)

פיתוח וניהול של סוכני AI באמצעות Gemma 4 ו-Agent Development Kit (ADK). יכולות ההסקה והפעלת הפונקציות החזקות של Gemma 4 הופכות אותו לאידיאלי לתהליכי עבודה של סוכני AI.

Gemini Enterprise Agent Platform Training Clusters

איך מבצעים התאמה עדינה של Gemma 4 באמצעות Gemini Enterprise Agent Platform Training Clusters ‫Training Clusters מספקת תשתית שעברה אופטימיזציה לאימון ולשיפור של מודלים פתוחים בקנה מידה גדול.

‫vLLM עם מעבדי TPU

מילו בקשות של Gemma 4 ב-Google Cloud TPUs כדי לקבל את ביצועי המילו הטובים ביותר.

MaxText

‫Gemma 4 נתמך ב-MaxText, הטמעה של JAX LLM בגודל שרירותי עם ביצועים גבוהים עבור TPU ב-Google Cloud.

Sovereign Cloud

‫Gemma 4 זמין בפתרונות Sovereign Cloud, ומספק בקרה ותאימות משופרות לעומסי עבודה רגישים.