Google Kubernetes Engine (GKE) 与 Gemma

Google Kubernetes Engine (GKE) 一项来自 Google Cloud 的代管式 Kubernetes 服务, 来大规模部署和运行容器化应用 Google 的基础架构。您可以使用 Cloud Tensor 处理单元来为 Gemma 提供数据 (TPU) 和 GKE 上的图形处理单元 (GPU),这些 LLM 服务 框架:

通过在 GKE 上运行 Gemma,您可以实现可用于生产环境的强大推理 提供具有代管式 Kubernetes 所有优势的服务解决方案, 更高的可伸缩性和可用性

如需了解详情,请参阅以下页面: