Google Cloud platformu, aşağıdakiler de dahil olmak üzere Gemma 4 açık modellerini dağıtma, sunma ve ince ayar yapma konusunda birçok seçenek sunar:
- Vertex AI Model Garden
- Cloud Run
- Google Kubernetes Engine (GKE)
- Aracı Geliştirme Kiti (ADK)
- Vertex AI Eğitim Kümeleri (VTC)
- MaxText
- TPU'larla vLLM
- Sovereign Cloud
Vertex AI Model Garden
Vertex AI, makine öğrenimi projelerini hızlı bir şekilde oluşturup ölçeklendirmek için kullanılan bir Google Cloud platformudur. Gemma 4, Vertex AI'daki özenle seçilmiş modellerden oluşan bir koleksiyon olan Model Garden'da kullanılabilir. Modelleri doğrudan konsoldan test edip dağıtabilirsiniz.
Daha fazla bilgi edinmek için aşağıdaki sayfalara bakın:
- Vertex AI'a giriş: Vertex AI'ı kullanmaya başlayın.
- Vertex AI ile Gemma: Gemma açık modellerini Vertex AI ile kullanın.
Cloud Run
Cloud Run, kodunuzu veya container'larınızı Google'ın yüksek oranda ölçeklenebilir altyapısında çalıştırmak için kullanılan, tümüyle yönetilen bir platformdur. Gemma 4'ü Cloud Run'da dağıtın. Sıfıra ölçeklendirme, kullandıkça öde çıkarımı için GPU'ları kullanın.
Daha büyük model boyutları için RTX 6000 Pro GPU'lar ve Model Akışı ile gelişmiş yapılandırmalardan yararlanın.
Google Kubernetes Engine (GKE)
Google Kubernetes Engine (GKE), Google Cloud'un yönetilen Kubernetes hizmetidir. Kurumsal düzeyde container düzenleme için GKE'de Gemma 4'ü çalıştırın. Yüksek gönderim hacmi ve düşük gecikme süresiyle modeller sunmak için TPU'ları ve GPU'ları kullanın.
Agent Development Kit (ADK)
Gemma 4 ve Agent Development Kit (ADK) ile yapay zeka ajanları oluşturun ve düzenleyin. Gemma 4'ün güçlü muhakeme ve işlev çağrısı özellikleri, onu bağımsız iş akışları için ideal kılar.
Vertex AI Training Clusters (VTC)
Vertex AI Training Clusters (VTC) kullanarak Gemma 4'ü ince ayar yapın. GD, açık modellerin büyük ölçekli eğitimi ve ince ayarı için optimize edilmiş altyapı sağlar.
TPU'larla vLLM
En iyi sunma performansı için Google Cloud TPU'larda Gemma 4'ü sunun.
MaxText
Gemma 4, Google Cloud TPU'lar için yüksek performanslı, rastgele boyutlu bir JAX LLM uygulaması olan MaxText'te desteklenir.
Sovereign Cloud
Gemma 4, hassas iş yükleri için gelişmiş kontrol ve uygunluk sağlayan Sovereign Cloud çözümlerinde kullanılabilir.