Google Kubernetes Engine (GKE) с Gemma

Google Kubernetes Engine (GKE) — это управляемый сервис Kubernetes от Google Cloud, который можно использовать для развертывания и эксплуатации контейнерных приложений в любом масштабе с использованием инфраструктуры Google. Вы можете обслуживать Gemma, используя процессоры Cloud Tensor (TPU) и графические процессоры (GPU) на GKE с помощью следующих платформ обслуживания LLM:

Обслуживая Gemma на GKE, вы можете реализовать надежное, готовое к использованию решение для обслуживания выводов со всеми преимуществами управляемого Kubernetes, включая эффективную масштабируемость и более высокую доступность.

Чтобы узнать больше, обратитесь к следующим страницам: