Google Kubernetes Engine (GKE) עם Gemma

Google Kubernetes Engine (GKE) הוא שירות Kubernetes מנוהל מ-Google Cloud, שאפשר לפרוס ולהפעיל אפליקציות בקונטיינרים בקנה מידה נרחב באמצעות התשתית של Google. אפשר למלא בקשות ל-Gemma באמצעות יחידות עיבוד של Cloud Tensor (מעבדי TPU) ויחידות עיבוד גרפיות (GPU) ב-GKE עם מילוי בקשות ל-LLM frameworks:

על ידי הצגת Gemma ב-GKE, אפשר להטמיע מסקנות עוצמתיות ומוכן לייצור פתרון למילוי בקשות שכולל את כל היתרונות של Kubernetes מנוהלת, כולל יכולת מדרגיות יעילה וזמינות גבוהה יותר.

מידע נוסף זמין בדפים הבאים: