Google Kubernetes Engine (GKE) mit Gemma

Google Kubernetes Engine (GKE) ist einem verwalteten Kubernetes-Dienst von Google Cloud, der können Sie Containeranwendungen mit die Infrastruktur von Google. Sie können Gemma mit Cloud Tensor-Verarbeitungseinheiten bereitstellen (TPUs) und Grafikprozessoren (GPUs) in GKE mit dieser LLM-Bereitstellung Frameworks:

Durch das Bereitstellen von Gemma in GKE können Sie eine robuste, produktionsreife Inferenz implementieren Bereitstellungslösung mit allen Vorteilen einer verwalteten Kubernetes-Umgebung wie eine effiziente Skalierbarkeit und eine höhere Verfügbarkeit.

Weitere Informationen finden Sie auf den folgenden Seiten: