Google Kubernetes Engine (GKE) z Gemma

Google Kubernetes Engine (GKE) to zarządzaną usługę Kubernetes z Google Cloud, których można używać do wdrażania i obsługi skonteneryzowanych aplikacji na dużą skalę Infrastruktura Google. Możesz obsługiwać Gemma za pomocą jednostek przetwarzania Cloud Tensor (TPU) i graficzne jednostki przetwarzania (GPU) w GKE z obsługą tych modeli LLM platformy:

Wykorzystując Gemma w GKE, możesz wdrożyć solidne wnioskowanie gotowe do wykorzystania w środowisku produkcyjnym i udostępnia wszystkie zalety zarządzanej usługi Kubernetes, w tym aby umożliwić sprawną skalowalność i zwiększyć dostępność.

Więcej informacji znajdziesz na tych stronach: