Google Kubernetes Engine (GKE) dengan Gemma

Google Kubernetes Engine (GKE) merupakan layanan Kubernetes terkelola dari Google Cloud yang dapat Anda gunakan untuk men-deploy dan mengoperasikan aplikasi dalam container berskala besar menggunakan infrastruktur Google. Anda dapat menyalurkan Gemma menggunakan unit pemrosesan Cloud Tensor (TPU) dan unit pemrosesan grafis (GPU) di GKE dengan fungsi LLM ini framework:

Dengan menyajikan Gemma di GKE, Anda dapat mengimplementasikan inferensi yang tangguh dan siap produksi inferensi dengan semua manfaat Kubernetes terkelola, termasuk skalabilitas yang efisien dan ketersediaan yang lebih tinggi.

Untuk mempelajari lebih lanjut, lihat halaman berikut: