Die Google Cloud-Plattform bietet viele Optionen zum Bereitstellen, Bereitstellen und Feinabstimmen von offenen Gemma 4-Modellen, darunter die folgenden:
- Gemini Enterprise Agent Platform
- Cloud Run
- Google Kubernetes Engine (GKE)
- Agent Development Kit (ADK)
- Gemini Enterprise Agent Platform-Trainingscluster
- MaxText
- vLLM mit TPUs
- Sovereign Cloud
Gemini Enterprise Agent Platform
Die Gemini Enterprise Agent Platform ist eine Google Cloud-Plattform zum schnellen Erstellen und Skalieren von Projekten für maschinelles Lernen. Gemma 4 ist im Model Garden verfügbar, einer kuratierten Sammlung von Modellen auf der Gemini Enterprise Agent Platform. Sie können Modelle direkt über die Konsole testen und bereitstellen.
Weitere Informationen finden Sie auf den folgenden Seiten:
- Übersicht über die Agent Platform: Erste Schritte mit der Gemini Enterprise Agent Platform.
- Gemma mit Gemini Enterprise Agent Platform: Verwenden Sie offene Gemma-Modelle mit der Gemini Enterprise Agent Platform.
Cloud Run
Cloud Run ist eine vollständig verwaltete Plattform, mit der Sie Code oder Container auf der hoch skalierbaren Infrastruktur von Google ausführen können. Gemma 4 in Cloud Run bereitstellen und GPUs für die Scale-to-Zero-Inferenz mit nutzungsbasierter Abrechnung verwenden.
Bei größeren Modellgrößen können Sie erweiterte Konfigurationen mit RTX 6000 Pro-GPUs und Model Streaming nutzen.
Google Kubernetes Engine (GKE)
Google Kubernetes Engine (GKE) ist ein verwalteter Kubernetes-Dienst von Google Cloud. Gemma 4 in GKE ausführen für die Containerorchestrierung auf Unternehmensniveau. Verwenden Sie TPUs und GPUs, um Modelle mit hohem Durchsatz und niedriger Latenz bereitzustellen.
Agent Development Kit (ADK)
KI-Agents mit Gemma 4 und dem Agent Development Kit (ADK) erstellen und orchestrieren. Die leistungsstarken Funktionen von Gemma 4 für die Problemlösung und den Funktionsaufruf machen das Modell ideal für agentische Workflows.
Trainingscluster für die Gemini Enterprise Agent Platform
Gemma 4 mit Gemini Enterprise Agent Platform-Trainingsclustern abstimmen Training Clusters bietet eine optimierte Infrastruktur für das Training und die Feinabstimmung von Open-Source-Modellen im großen Maßstab.
vLLM mit TPUs
Gemma 4 auf Google Cloud-TPUs bereitstellen, um eine optimale Bereitstellungsleistung zu erzielen.
MaxText
Gemma 4 wird in MaxText unterstützt, einer leistungsstarken, beliebig großen JAX-LLM-Implementierung für Google Cloud-TPUs.
Sovereign Cloud
Gemma 4 ist für Sovereign Cloud-Lösungen verfügbar und bietet verbesserte Kontrolle und Compliance für sensible Arbeitslasten.