Platform Google Cloud menyediakan banyak opsi untuk men-deploy, menayangkan, dan menyesuaikan model terbuka Gemma 4, termasuk yang berikut:
- Gemini Enterprise Agent Platform
- Cloud Run
- Google Kubernetes Engine (GKE)
- Agent Development Kit (ADK)
- Cluster Pelatihan Gemini Enterprise Agent Platform
- MaxText
- vLLM dengan TPU
- Sovereign Cloud
Gemini Enterprise Agent Platform
Gemini Enterprise Agent Platform adalah platform Google Cloud untuk dengan cepat membangun dan menskalakan project machine learning. Gemma 4 tersedia di Model Garden, koleksi model pilihan di Gemini Enterprise Agent Platform. Anda dapat menguji dan men-deploy model langsung dari konsol.
Untuk mempelajari lebih lanjut, lihat halaman berikut:
- Ringkasan Agent Platform: Mulai menggunakan Gemini Enterprise Agent Platform.
- Gemma dengan Gemini Enterprise Agent Platform: Menggunakan model terbuka Gemma dengan Gemini Enterprise Agent Platform.
Cloud Run
Cloud Run adalah platform terkelola sepenuhnya untuk menjalankan kode atau container di atas infrastruktur Google yang sangat skalabel. Deploy Gemma 4 di Cloud Run menggunakan GPU untuk inferensi skala-ke-nol dan bayar sesuai penggunaan.
Untuk ukuran mode yang lebih besar, manfaatkan konfigurasi lanjutan dengan GPU RTX 6000 Pro dan Streaming Model.
Google Kubernetes Engine (GKE)
Google Kubernetes Engine (GKE) adalah layanan Kubernetes terkelola dari Google Cloud. Jalankan Gemma 4 di GKE untuk orkestrasi container tingkat perusahaan. Gunakan TPU dan GPU untuk menayangkan model dengan throughput tinggi dan latensi rendah.
Agent Development Kit (ADK)
Buat dan atur agen AI dengan Gemma 4 dan Agent Development Kit (ADK). Kemampuan penalaran dan pemanggilan fungsi Gemma 4 yang kuat menjadikannya ideal untuk alur kerja agentic.
Cluster Pelatihan Gemini Enterprise Agent Platform
Sesuaikan Gemma 4 menggunakan Pelatihan Gemini Enterprise Agent Platform Cluster. Cluster Pelatihan menyediakan infrastruktur yang dioptimalkan untuk pelatihan dan penyesuaian model terbuka skala besar.
vLLM dengan TPU
Tayangkan Gemma 4 di TPU Google Cloud untuk performa penayangan canggih.
MaxText
Gemma 4 didukung di MaxText, implementasi JAX LLM berperforma tinggi dan berukuran arbitrer untuk TPU Google Cloud.
Sovereign Cloud
Gemma 4 tersedia di solusi Sovereign Cloud, yang memberikan kontrol dan kepatuhan yang ditingkatkan untuk workload sensitif.