Google Kubernetes Engine (GKE) พร้อม Gemma

Google Kubernetes Engine (GKE) คือบริการ Kubernetes ที่มีการจัดการจาก Google Cloud ซึ่งคุณสามารถใช้เพื่อปรับใช้และดำเนินการกับแอปพลิเคชันที่มีคอนเทนเนอร์จำนวนมากโดยใช้โครงสร้างพื้นฐานของ Google คุณสามารถให้บริการ Gemma โดยใช้หน่วยประมวลผล Cloud Tensor หน่วยประมวลผล (TPU) และหน่วยประมวลผลกราฟิก (GPU) บน GKE ด้วยเฟรมเวิร์กการแสดงผล LLM ต่อไปนี้

การให้บริการ Gemma บน GKE ทำให้คุณใช้โซลูชันการอนุมานที่มีประสิทธิภาพและพร้อมสำหรับเวอร์ชันที่ใช้งานจริงพร้อมคุณประโยชน์ทั้งหมดของ Kubernetes ที่มีการจัดการ ซึ่งรวมถึงความสามารถในการปรับขนาดและความพร้อมใช้งานที่สูงขึ้น

ดูข้อมูลเพิ่มเติมได้ที่หน้าต่อไปนี้