ติดตั้งใช้งาน Gemma ด้วย Google Cloud

แพลตฟอร์ม Google Cloud มีตัวเลือกมากมายสำหรับการติดตั้งใช้งาน การให้บริการ และการปรับแต่งโมเดลแบบเปิดของ Gemma 4 ซึ่งรวมถึงตัวเลือกต่อไปนี้

แพลตฟอร์ม Agent ของ Gemini Enterprise

แพลตฟอร์ม Agent ของ Gemini Enterprise คือแพลตฟอร์ม Google Cloud สำหรับการสร้างและปรับขนาดโปรเจ็กต์แมชชีนเลิร์นนิงอย่างรวดเร็ว Gemma 4 พร้อมใช้งานใน Model Garden ซึ่งเป็นคอลเล็กชันโมเดลที่คัดสรรมาแล้วในแพลตฟอร์ม Agent ของ Gemini Enterprise คุณสามารถทดสอบและติดตั้งใช้งานโมเดลได้โดยตรงจากคอนโซล

ดูข้อมูลเพิ่มเติมได้ที่หน้าต่อไปนี้

Cloud Run

Cloud Run เป็นแพลตฟอร์มที่มีการจัดการครบวงจรสำหรับเรียกใช้โค้ดหรือคอนเทนเนอร์บนโครงสร้างพื้นฐานที่ปรับขนาดได้สูงของ Google ติดตั้งใช้งาน Gemma 4 บน Cloud Run โดยใช้ GPU สำหรับการอนุมานแบบปรับขนาดเป็น 0 และจ่ายตามการใช้งาน

สำหรับขนาดโมเดลที่ใหญ่ขึ้น ให้ใช้การกำหนดค่าขั้นสูงกับ RTX 6000 Pro GPUs และการสตรีมโมเดล

Google Kubernetes Engine (GKE)

Google Kubernetes Engine (GKE) คือบริการ Kubernetes ที่มีการจัดการจาก Google Cloud เรียกใช้ Gemma 4 บน GKE เพื่อการจัดการคอนเทนเนอร์ระดับองค์กร ใช้ TPU และ GPU เพื่อแสดงโมเดลที่มีปริมาณงานสูงและความหน่วงต่ำ

Agent Development Kit (ADK)

สร้างและจัดระเบียบ AI Agent ด้วย Gemma 4 และ Agent Development Kit (ADK) ความสามารถในการให้เหตุผลและการเรียกใช้ฟังก์ชันที่ยอดเยี่ยมของ Gemma 4 ทำให้โมเดลนี้เหมาะสำหรับเวิร์กโฟลว์ที่ใช้ AI

คลัสเตอร์การฝึก Agent ของ Gemini Enterprise

ปรับแต่ง Gemma 4 โดยใช้คลัสเตอร์การฝึกแพลตฟอร์ม Agent ของ Gemini Enterprise คลัสเตอร์การฝึกจะมอบโครงสร้างพื้นฐานที่ได้รับการเพิ่มประสิทธิภาพสำหรับการฝึกและการปรับแต่งโมเดลแบบเปิดขนาดใหญ่

vLLM กับ TPU

แสดง Gemma 4 บน Google Cloud TPU เพื่อประสิทธิภาพการแสดงผลที่ล้ำสมัย

MaxText

Gemma 4 ได้รับการรองรับใน MaxText ซึ่งเป็นการติดตั้งใช้งาน JAX LLM ประสิทธิภาพสูงที่มีขนาดตามต้องการสำหรับ Google Cloud TPU

Sovereign Cloud

Gemma 4 พร้อมให้บริการในโซลูชัน Sovereign Cloud ซึ่งช่วยเพิ่ม การควบคุมและการปฏิบัติตามข้อกำหนดสำหรับภาระงานที่มีความละเอียดอ่อน