แพลตฟอร์ม Google Cloud มีตัวเลือกมากมายสำหรับการติดตั้งใช้งาน การให้บริการ และการปรับแต่งโมเดลแบบเปิดของ Gemma 4 ซึ่งรวมถึงตัวเลือกต่อไปนี้
- แพลตฟอร์ม Agent ของ Gemini Enterprise
- Cloud Run
- Google Kubernetes Engine (GKE)
- ชุดพัฒนาเอเจนต์ (ADK)
- คลัสเตอร์การฝึกแพลตฟอร์ม Agent ของ Gemini Enterprise
- MaxText
- vLLM ด้วย TPU
- Sovereign Cloud
แพลตฟอร์ม Agent ของ Gemini Enterprise
แพลตฟอร์ม Agent ของ Gemini Enterprise คือแพลตฟอร์ม Google Cloud สำหรับการสร้างและปรับขนาดโปรเจ็กต์แมชชีนเลิร์นนิงอย่างรวดเร็ว Gemma 4 พร้อมใช้งานใน Model Garden ซึ่งเป็นคอลเล็กชันโมเดลที่คัดสรรมาแล้วในแพลตฟอร์ม Agent ของ Gemini Enterprise คุณสามารถทดสอบและติดตั้งใช้งานโมเดลได้โดยตรงจากคอนโซล
ดูข้อมูลเพิ่มเติมได้ที่หน้าต่อไปนี้
- ภาพรวมของ Agent Platform: เริ่มต้นใช้งาน Agent Platform ของ Gemini Enterprise
- Gemma กับแพลตฟอร์ม Agent ของ Gemini Enterprise: ใช้โมเดลแบบเปิดของ Gemma กับแพลตฟอร์ม Agent ของ Gemini Enterprise
Cloud Run
Cloud Run เป็นแพลตฟอร์มที่มีการจัดการครบวงจรสำหรับเรียกใช้โค้ดหรือคอนเทนเนอร์บนโครงสร้างพื้นฐานที่ปรับขนาดได้สูงของ Google ติดตั้งใช้งาน Gemma 4 บน Cloud Run โดยใช้ GPU สำหรับการอนุมานแบบปรับขนาดเป็น 0 และจ่ายตามการใช้งาน
สำหรับขนาดโมเดลที่ใหญ่ขึ้น ให้ใช้การกำหนดค่าขั้นสูงกับ RTX 6000 Pro GPUs และการสตรีมโมเดล
Google Kubernetes Engine (GKE)
Google Kubernetes Engine (GKE) คือบริการ Kubernetes ที่มีการจัดการจาก Google Cloud เรียกใช้ Gemma 4 บน GKE เพื่อการจัดการคอนเทนเนอร์ระดับองค์กร ใช้ TPU และ GPU เพื่อแสดงโมเดลที่มีปริมาณงานสูงและความหน่วงต่ำ
Agent Development Kit (ADK)
สร้างและจัดระเบียบ AI Agent ด้วย Gemma 4 และ Agent Development Kit (ADK) ความสามารถในการให้เหตุผลและการเรียกใช้ฟังก์ชันที่ยอดเยี่ยมของ Gemma 4 ทำให้โมเดลนี้เหมาะสำหรับเวิร์กโฟลว์ที่ใช้ AI
คลัสเตอร์การฝึก Agent ของ Gemini Enterprise
ปรับแต่ง Gemma 4 โดยใช้คลัสเตอร์การฝึกแพลตฟอร์ม Agent ของ Gemini Enterprise คลัสเตอร์การฝึกจะมอบโครงสร้างพื้นฐานที่ได้รับการเพิ่มประสิทธิภาพสำหรับการฝึกและการปรับแต่งโมเดลแบบเปิดขนาดใหญ่
vLLM กับ TPU
แสดง Gemma 4 บน Google Cloud TPU เพื่อประสิทธิภาพการแสดงผลที่ล้ำสมัย
MaxText
Gemma 4 ได้รับการรองรับใน MaxText ซึ่งเป็นการติดตั้งใช้งาน JAX LLM ประสิทธิภาพสูงที่มีขนาดตามต้องการสำหรับ Google Cloud TPU
Sovereign Cloud
Gemma 4 พร้อมให้บริการในโซลูชัน Sovereign Cloud ซึ่งช่วยเพิ่ม การควบคุมและการปฏิบัติตามข้อกำหนดสำหรับภาระงานที่มีความละเอียดอ่อน