Google Kubernetes Engine (GKE) dengan Gemma

Google Kubernetes Engine (GKE) adalah layanan Kubernetes terkelola dari Google Cloud yang dapat Anda gunakan untuk men-deploy dan mengoperasikan aplikasi dalam container dalam skala besar menggunakan infrastruktur Google. Anda dapat menyalurkan Gemma menggunakan Cloud Tensor Processing Unit (TPU) dan unit pemrosesan grafis (GPU) di GKE dengan framework penayangan LLM berikut:

Dengan menyalurkan Gemma di GKE, Anda dapat mengimplementasikan solusi penayangan inferensi yang tangguh dan siap produksi dengan semua manfaat Kubernetes terkelola, termasuk skalabilitas yang efisien dan ketersediaan yang lebih tinggi.

Untuk mempelajari lebih lanjut, lihat halaman berikut: