‫Gemma 4 הושק עם קלט של טקסט, אודיו ותמונות, וחלון הקשר ארוך של עד 256 אלף טוקנים. מידע נוסף

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

פריסת Gemma באמצעות Google Cloud

פלטפורמת Google Cloud מספקת הרבה אפשרויות לפריסה, להצגה ולכוונון עדין של מודלים פתוחים של Gemma 4, כולל:

Gemini Enterprise Agent Platform
Cloud Run
Google Kubernetes Engine (GKE)‎
ערכת פיתוח של סוכנים (ADK)
Gemini Enterprise Agent Platform Training Clusters
MaxText
‫vLLM עם מעבדי TPU
Sovereign Cloud

פלטפורמת הסוכנים של Gemini Enterprise

‫Gemini Enterprise Agent Platform היא פלטפורמה של Google Cloud שמאפשרת לבנות ולהרחיב במהירות פרויקטים של למידת מכונה. ‫Gemma 4 זמין ב-Model Garden, אוסף של מודלים שנבחרו בקפידה ב-Gemini Enterprise Agent Platform. אפשר לבדוק ולפרוס מודלים ישירות מהמסוף.

מידע נוסף זמין בדפים הבאים:

סקירה כללית של Agent Platform: איך מתחילים להשתמש ב-Gemini Enterprise Agent Platform.
‫Gemma עם Gemini Enterprise Agent Platform: אפשר להשתמש במודלים פתוחים של Gemma עם Gemini Enterprise Agent Platform.

Cloud Run

‫Cloud Run היא פלטפורמה מנוהלת לחלוטין להרצת קוד או קונטיינרים על גבי התשתית של Google, שאפשר להתאים לעומס. פריסת Gemma 4 ב-Cloud Run באמצעות יחידות GPU להסקת מסקנות עם תשלום לפי שימוש ושינוי קנה מידה לאפס.

לגודלי מודלים גדולים יותר, אפשר להשתמש בהגדרות מתקדמות עם מעבדי RTX 6000 Pro גרפיים והזרמת מודלים.

Google Kubernetes Engine (‏GKE)

‫Google Kubernetes Engine‏ (GKE) הוא שירות Kubernetes מנוהל מבית Google Cloud. הפעלת Gemma 4 ב-GKE לתזמור קונטיינרים ברמה שמתאימה לארגונים. שימוש ביחידות TPU ו-GPU להצגת מודלים עם תפוקה גבוהה וזמן אחזור נמוך.

ערכה לפיתוח סוכנים (ADK)

פיתוח וניהול של סוכני AI באמצעות Gemma 4 ו-Agent Development Kit (ADK). יכולות ההסקה והפעלת הפונקציות החזקות של Gemma 4 הופכות אותו לאידיאלי לתהליכי עבודה של סוכני AI.

Gemini Enterprise Agent Platform Training Clusters

איך מבצעים התאמה עדינה של Gemma 4 באמצעות Gemini Enterprise Agent Platform Training Clusters ‫Training Clusters מספקת תשתית שעברה אופטימיזציה לאימון ולשיפור של מודלים פתוחים בקנה מידה גדול.

‫vLLM עם מעבדי TPU

מילו בקשות של Gemma 4 ב-Google Cloud TPUs כדי לקבל את ביצועי המילו הטובים ביותר.

MaxText

‫Gemma 4 נתמך ב-MaxText, הטמעה של JAX LLM בגודל שרירותי עם ביצועים גבוהים עבור TPU ב-Google Cloud.

Sovereign Cloud

‫Gemma 4 זמין בפתרונות Sovereign Cloud, ומספק בקרה ותאימות משופרות לעומסי עבודה רגישים.