ติดตั้งใช้งาน Gemma ด้วย Google Cloud

แพลตฟอร์ม Google Cloud มีตัวเลือกมากมายสำหรับการติดตั้งใช้งาน การแสดงผล และการปรับแต่งโมเดลแบบเปิดของ Gemma 4 ซึ่งรวมถึงตัวเลือกต่อไปนี้

Vertex AI Model Garden

Vertex AI เป็นแพลตฟอร์ม Google Cloud สำหรับ การสร้างและปรับขนาดโปรเจ็กต์แมชชีนเลิร์นนิงอย่างรวดเร็ว Gemma 4 พร้อมให้บริการใน Model Garden ซึ่งเป็นคอลเล็กชันโมเดลที่คัดสรรมาแล้วใน Vertex AI คุณสามารถทดสอบและติดตั้งใช้งานโมเดลได้โดยตรงจากคอนโซล

ดูข้อมูลเพิ่มเติมได้ที่หน้าต่อไปนี้

Cloud Run

Cloud Run เป็นแพลตฟอร์มที่มีการจัดการครบวงจร เพื่อเรียกใช้โค้ดหรือคอนเทนเนอร์บน โครงสร้างพื้นฐานที่ปรับขนาดได้สูงของ Google ติดตั้งใช้งาน Gemma 4 บน Cloud Run โดยใช้ GPU สำหรับการอนุมานแบบลดขนาดเหลือศูนย์และแบบจ่ายตามการใช้งาน

สำหรับโมเดลขนาดใหญ่ขึ้น ให้ใช้การกำหนดค่าขั้นสูง ด้วย RTX 6000 Pro GPU และการสตรีมโมเดล

Google Kubernetes Engine (GKE)

Google Kubernetes Engine (GKE) คือบริการ Kubernetes ที่มีการจัดการจาก Google Cloud เรียกใช้ Gemma 4 ใน GKE เพื่อการจัดการคอนเทนเนอร์ระดับองค์กร ใช้ TPU และ GPU เพื่อแสดงโมเดลที่มีปริมาณงานสูงและความหน่วงต่ำ

Agent Development Kit (ADK)

สร้างและจัดการ AI Agent ด้วย Gemma 4 และ Agent Development Kit (ADK) ความสามารถในการให้เหตุผลและการเรียกใช้ฟังก์ชันที่ยอดเยี่ยมของ Gemma 4 ทำให้เหมาะสำหรับ เวิร์กโฟลว์แบบเอเจนต์

คลัสเตอร์การฝึก Vertex AI (VTC)

ปรับแต่ง Gemma 4 โดยใช้คลัสเตอร์การฝึก Vertex AI (VTC) VTC มีโครงสร้างพื้นฐานที่เพิ่มประสิทธิภาพสำหรับการฝึกขนาดใหญ่ และการปรับแต่งโมเดลแบบเปิด

vLLM กับ TPU

แสดง Gemma 4 บน TPU ของ Google Cloud เพื่อประสิทธิภาพการแสดงผลที่ล้ำสมัย

MaxText

MaxText รองรับ Gemma 4 ซึ่งเป็นการติดตั้งใช้งาน JAX LLM ประสิทธิภาพสูง ที่มีขนาดตามต้องการสำหรับ Google Cloud TPU

Sovereign Cloud

Gemma 4 พร้อมใช้งานในโซลูชัน Sovereign Cloud ซึ่งให้การควบคุมและการปฏิบัติตามข้อกำหนดที่ดียิ่งขึ้นสำหรับภาระงานที่มีความละเอียดอ่อน