Google Kubernetes Engine (GKE) 与 Gemma
使用集合让一切井井有条
根据您的偏好保存内容并对其进行分类。
Google Kubernetes Engine (GKE) 是 Google Cloud 提供的一项代管式 Kubernetes 服务,可用于使用 Google 的基础架构大规模部署和运行容器化应用。您可以通过以下 LLM 服务框架在 GKE 上使用 Cloud Tensor 处理单元 (TPU) 和图形处理单元 (GPU) 为 Gemma 提供服务:
通过在 GKE 上为 Gemma 提供服务,您可以实现一个功能强大且可直接用于生产的推理服务解决方案,同时享受代管式 Kubernetes 的所有优势,包括高效的可伸缩性和更高的可用性。
如需了解详情,请参阅以下页面:
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2024-04-09。
[{
"type": "thumb-down",
"id": "missingTheInformationINeed",
"label":"没有我需要的信息"
},{
"type": "thumb-down",
"id": "tooComplicatedTooManySteps",
"label":"太复杂/步骤太多"
},{
"type": "thumb-down",
"id": "outOfDate",
"label":"内容需要更新"
},{
"type": "thumb-down",
"id": "translationIssue",
"label":"翻译问题"
},{
"type": "thumb-down",
"id": "samplesCodeIssue",
"label":"示例/代码问题"
},{
"type": "thumb-down",
"id": "otherDown",
"label":"其他"
}]
[{
"type": "thumb-up",
"id": "easyToUnderstand",
"label":"易于理解"
},{
"type": "thumb-up",
"id": "solvedMyProblem",
"label":"解决了我的问题"
},{
"type": "thumb-up",
"id": "otherUp",
"label":"其他"
}]