Google Kubernetes Engine (GKE) con Gemma

Google Kubernetes Engine (GKE) è un servizio Kubernetes gestito di Google Cloud per eseguire il deployment e gestire applicazioni containerizzate su larga scala l'infrastruttura di Google. Puoi gestire Gemma utilizzando le unità di elaborazione Cloud Tensor (TPU) e GPU (Graphics Processing Unit) su GKE con questi modelli di gestione LLM i modelli:

Pubblicando Gemma su GKE, puoi implementare un'inferenza solida e pronta per la produzione di Google Cloud con tutti i vantaggi di Kubernetes gestito, una scalabilità efficiente e una maggiore disponibilità.

Per saperne di più, consulta le seguenti pagine: