Gemma 4 เปิดตัวพร้อมอินพุตข้อความ เสียง และรูปภาพ รวมถึงหน้าต่างบริบทแบบยาวที่มีโทเค็นให้ถึง 2.56 แสนโทเค็น ดูข้อมูลเพิ่มเติม

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

ติดตั้งใช้งาน Gemma ด้วย Google Cloud

แพลตฟอร์ม Google Cloud มีตัวเลือกมากมายสำหรับการติดตั้งใช้งาน การแสดงผล และการปรับแต่งโมเดลแบบเปิดของ Gemma 4 ซึ่งรวมถึงตัวเลือกต่อไปนี้

Vertex AI Model Garden
Cloud Run
Google Kubernetes Engine (GKE)
ชุดพัฒนา Agent (ADK)
คลัสเตอร์การฝึก Vertex AI (VTC)
MaxText
vLLM ด้วย TPU
Sovereign Cloud

Vertex AI Model Garden

Vertex AI เป็นแพลตฟอร์ม Google Cloud สำหรับ การสร้างและปรับขนาดโปรเจ็กต์แมชชีนเลิร์นนิงอย่างรวดเร็ว Gemma 4 พร้อมให้บริการใน Model Garden ซึ่งเป็นคอลเล็กชันโมเดลที่คัดสรรมาแล้วใน Vertex AI คุณสามารถทดสอบและติดตั้งใช้งานโมเดลได้โดยตรงจากคอนโซล

ดูข้อมูลเพิ่มเติมได้ที่หน้าต่อไปนี้

ข้อมูลเบื้องต้นเกี่ยวกับ Vertex AI: เริ่มต้นใช้งาน Vertex AI
Gemma กับ Vertex AI: ใช้โมเดลโอเพนซอร์ส Gemma กับ Vertex AI

Cloud Run

Cloud Run เป็นแพลตฟอร์มที่มีการจัดการครบวงจร เพื่อเรียกใช้โค้ดหรือคอนเทนเนอร์บน โครงสร้างพื้นฐานที่ปรับขนาดได้สูงของ Google ติดตั้งใช้งาน Gemma 4 บน Cloud Run โดยใช้ GPU สำหรับการอนุมานแบบลดขนาดเหลือศูนย์และแบบจ่ายตามการใช้งาน

สำหรับโมเดลขนาดใหญ่ขึ้น ให้ใช้การกำหนดค่าขั้นสูง ด้วย RTX 6000 Pro GPU และการสตรีมโมเดล

Google Kubernetes Engine (GKE)

Google Kubernetes Engine (GKE) คือบริการ Kubernetes ที่มีการจัดการจาก Google Cloud เรียกใช้ Gemma 4 ใน GKE เพื่อการจัดการคอนเทนเนอร์ระดับองค์กร ใช้ TPU และ GPU เพื่อแสดงโมเดลที่มีปริมาณงานสูงและความหน่วงต่ำ

Agent Development Kit (ADK)

สร้างและจัดการ AI Agent ด้วย Gemma 4 และ Agent Development Kit (ADK) ความสามารถในการให้เหตุผลและการเรียกใช้ฟังก์ชันที่ยอดเยี่ยมของ Gemma 4 ทำให้เหมาะสำหรับ เวิร์กโฟลว์แบบเอเจนต์

คลัสเตอร์การฝึก Vertex AI (VTC)

ปรับแต่ง Gemma 4 โดยใช้คลัสเตอร์การฝึก Vertex AI (VTC) VTC มีโครงสร้างพื้นฐานที่เพิ่มประสิทธิภาพสำหรับการฝึกขนาดใหญ่ และการปรับแต่งโมเดลแบบเปิด

vLLM กับ TPU

แสดง Gemma 4 บน TPU ของ Google Cloud เพื่อประสิทธิภาพการแสดงผลที่ล้ำสมัย

MaxText

MaxText รองรับ Gemma 4 ซึ่งเป็นการติดตั้งใช้งาน JAX LLM ประสิทธิภาพสูง ที่มีขนาดตามต้องการสำหรับ Google Cloud TPU

Sovereign Cloud

Gemma 4 พร้อมใช้งานในโซลูชัน Sovereign Cloud ซึ่งให้การควบคุมและการปฏิบัติตามข้อกำหนดที่ดียิ่งขึ้นสำหรับภาระงานที่มีความละเอียดอ่อน