Google Kubernetes Engine (GKE) mit Gemma

Google Kubernetes Engine (GKE) ist ein verwalteter Kubernetes-Dienst von Google Cloud, mit dem Sie in großem Maßstab Containeranwendungen über die Google-Infrastruktur bereitstellen und betreiben können. Mit den folgenden LLM-Frameworks können Sie Gemma mit Cloud Tensor-Verarbeitungseinheiten (TPUs) und Grafikprozessoren (GPUs) in GKE bereitstellen:

Durch die Bereitstellung von Gemma in GKE können Sie eine robuste, produktionsreife Inferenzlösung mit allen Vorteilen von verwaltetem Kubernetes implementieren, einschließlich effizienter Skalierbarkeit und höherer Verfügbarkeit.

Weitere Informationen finden Sie auf den folgenden Seiten: