Gemma 4 dirilis dengan input teks, audio, dan gambar serta jendela konteks panjang hingga 256K token. Pelajari lebih lanjut

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Men-deploy Gemma dengan Google Cloud

Platform Google Cloud menyediakan banyak opsi untuk men-deploy, menayangkan, dan menyesuaikan model terbuka Gemma 4, termasuk yang berikut:

Vertex AI Model Garden
Cloud Run
Google Kubernetes Engine (GKE)
Agent Development Kit (ADK)
Vertex AI Training Clusters (VTC)
MaxText
vLLM dengan TPU
Sovereign Cloud

Vertex AI Model Garden

Vertex AI adalah platform Google Cloud untuk membangun dan menskalakan project machine learning dengan cepat. Gemma 4 tersedia di Model Garden, koleksi model pilihan di Vertex AI. Anda dapat menguji dan men-deploy model langsung dari konsol.

Untuk mempelajari lebih lanjut, lihat halaman berikut:

Pengantar Vertex AI: Mulai menggunakan Vertex AI.
Gemma dengan Vertex AI: Menggunakan model terbuka Gemma dengan Vertex AI.

Cloud Run

Cloud Run adalah platform terkelola sepenuhnya untuk menjalankan kode atau container di atas infrastruktur Google yang sangat skalabel. Deploy Gemma 4 di Cloud Run menggunakan GPU untuk inferensi skala-ke-nol dan bayar sesuai penggunaan.

Untuk ukuran mode yang lebih besar, manfaatkan konfigurasi lanjutan dengan GPU RTX 6000 Pro dan Streaming Model.

Google Kubernetes Engine (GKE)

Google Kubernetes Engine (GKE) adalah layanan Kubernetes terkelola dari Google Cloud. Jalankan Gemma 4 di GKE untuk orkestrasi container tingkat perusahaan. Gunakan TPU dan GPU untuk menayangkan model dengan throughput tinggi dan latensi rendah.

Agent Development Kit (ADK)

Buat dan atur agen AI dengan Gemma 4 dan Agent Development Kit (ADK). Kemampuan penalaran dan pemanggilan fungsi Gemma 4 yang kuat menjadikannya ideal untuk alur kerja agen.

Vertex AI Training Clusters (VTC)

Sesuaikan Gemma 4 menggunakan Vertex AI Training Clusters (VTC). VTC menyediakan infrastruktur yang dioptimalkan untuk pelatihan dan penyesuaian model terbuka skala besar.

vLLM dengan TPU

Tayangkan Gemma 4 di TPU Google Cloud untuk performa penayangan terbaik.

MaxText

Gemma 4 didukung di MaxText, implementasi JAX LLM berukuran arbitrer dan berperforma tinggi untuk TPU Google Cloud.

Sovereign Cloud

Gemma 4 tersedia di solusi Sovereign Cloud, yang memberikan kontrol dan kepatuhan yang ditingkatkan untuk workload sensitif.