Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
Google Kubernetes Engine (GKE) ist
einem verwalteten Kubernetes-Dienst von Google Cloud, der
können Sie Containeranwendungen mit
die Infrastruktur von Google. Sie können Gemma mit Cloud Tensor-Verarbeitungseinheiten bereitstellen
(TPUs) und Grafikprozessoren (GPUs) in GKE mit dieser LLM-Bereitstellung
Frameworks:
Durch das Bereitstellen von Gemma in GKE können Sie eine robuste, produktionsreife Inferenz implementieren
Bereitstellungslösung mit allen Vorteilen einer verwalteten Kubernetes-Umgebung wie
eine effiziente Skalierbarkeit
und eine höhere Verfügbarkeit.
Weitere Informationen finden Sie auf den folgenden Seiten:
GKE
Übersicht:
Erste Schritte mit der Google Kubernetes Engine (GKE)