搭配使用 Google Kubernetes Engine (GKE) 與 Gemma

Google Kubernetes Engine (GKE) 這是 Google Cloud 提供的代管 Kubernetes 服務 方便您大規模部署及操作容器化應用程式 基礎架構您可以使用 Cloud Tensor 處理單元提供 Gemma 服務 GKE 中的 (TPU) 和圖形處理器 (GPU) 搭配這些 LLM 服務 架構:

透過在 GKE 上提供 Gemma,您就能實作可用於實際工作環境的可靠推論 提供解決方案,具備代管 Kubernetes 的所有優點,包括 具備高效率的擴充性和可用性

詳情請參閱以下頁面: