Platform Google Cloud menyediakan banyak opsi untuk men-deploy, menayangkan, dan menyesuaikan model terbuka Gemma 4, termasuk yang berikut:
- Vertex AI Model Garden
- Cloud Run
- Google Kubernetes Engine (GKE)
- Agent Development Kit (ADK)
- Vertex AI Training Clusters (VTC)
- MaxText
- vLLM dengan TPU
- Sovereign Cloud
Vertex AI Model Garden
Vertex AI adalah platform Google Cloud untuk membangun dan menskalakan project machine learning dengan cepat. Gemma 4 tersedia di Model Garden, koleksi model pilihan di Vertex AI. Anda dapat menguji dan men-deploy model langsung dari konsol.
Untuk mempelajari lebih lanjut, lihat halaman berikut:
- Pengantar Vertex AI: Mulai menggunakan Vertex AI.
- Gemma dengan Vertex AI: Menggunakan model terbuka Gemma dengan Vertex AI.
Cloud Run
Cloud Run adalah platform terkelola sepenuhnya untuk menjalankan kode atau container di atas infrastruktur Google yang sangat skalabel. Deploy Gemma 4 di Cloud Run menggunakan GPU untuk inferensi skala-ke-nol dan bayar sesuai penggunaan.
Untuk ukuran mode yang lebih besar, manfaatkan konfigurasi lanjutan dengan GPU RTX 6000 Pro dan Streaming Model.
Google Kubernetes Engine (GKE)
Google Kubernetes Engine (GKE) adalah layanan Kubernetes terkelola dari Google Cloud. Jalankan Gemma 4 di GKE untuk orkestrasi container tingkat perusahaan. Gunakan TPU dan GPU untuk menayangkan model dengan throughput tinggi dan latensi rendah.
Agent Development Kit (ADK)
Buat dan atur agen AI dengan Gemma 4 dan Agent Development Kit (ADK). Kemampuan penalaran dan pemanggilan fungsi Gemma 4 yang kuat menjadikannya ideal untuk alur kerja agen.
Vertex AI Training Clusters (VTC)
Sesuaikan Gemma 4 menggunakan Vertex AI Training Clusters (VTC). VTC menyediakan infrastruktur yang dioptimalkan untuk pelatihan dan penyesuaian model terbuka skala besar.
vLLM dengan TPU
Tayangkan Gemma 4 di TPU Google Cloud untuk performa penayangan terbaik.
MaxText
Gemma 4 didukung di MaxText, implementasi JAX LLM berukuran arbitrer dan berperforma tinggi untuk TPU Google Cloud.
Sovereign Cloud
Gemma 4 tersedia di solusi Sovereign Cloud, yang memberikan kontrol dan kepatuhan yang ditingkatkan untuk workload sensitif.