Die Google Cloud-Plattform bietet viele Optionen zum Bereitstellen, Bereitstellen und Feinabstimmen von offenen Gemma 4-Modellen, darunter die folgenden:
- Vertex AI Model Garden
- Cloud Run
- Google Kubernetes Engine (GKE)
- Agent Development Kit (ADK)
- Vertex AI Training-Cluster (VTC)
- MaxText
- vLLM mit TPUs
- Sovereign Cloud
Vertex AI Model Garden
Vertex AI ist eine Google Cloud-Plattform zum schnellen Erstellen und Skalieren von Projekten für maschinelles Lernen. Gemma 4 ist im Model Garden verfügbar, einer kuratierten Sammlung von Modellen in Vertex AI. Sie können Modelle direkt über die Konsole testen und bereitstellen.
Weitere Informationen finden Sie auf den folgenden Seiten:
- Einführung in Vertex AI: Erste Schritte mit Vertex AI.
- Gemma mit Vertex AI: Verwenden Sie offene Gemma-Modelle mit Vertex AI.
Cloud Run
Cloud Run ist eine vollständig verwaltete Plattform, auf der Sie Ihren Code oder Ihre Container auf der hoch skalierbaren Infrastruktur von Google ausführen können. Gemma 4 auf Cloud Run bereitstellen und GPUs für Scale-to-Zero-Inferenz mit nutzungsbasierter Abrechnung verwenden.
Bei größeren Modellgrößen können Sie erweiterte Konfigurationen mit RTX 6000 Pro-GPUs und Model Streaming nutzen.
Google Kubernetes Engine (GKE)
Google Kubernetes Engine (GKE) ist ein verwalteter Kubernetes-Dienst von Google Cloud. Gemma 4 in GKE ausführen für die Containerorchestrierung auf Unternehmensniveau. Verwenden Sie TPUs und GPUs, um Modelle mit hohem Durchsatz und niedriger Latenz bereitzustellen.
Agent Development Kit (ADK)
KI-Agenten mit Gemma 4 und dem Agent Development Kit (ADK) erstellen und orchestrieren Die leistungsstarken Funktionen von Gemma 4 für Reasoning und Funktionsaufrufe machen es ideal für Agent-basierte Workflows.
Vertex AI-Trainingscluster (VTC)
Gemma 4 mit Vertex AI Training Clusters (VTC) optimieren. VTC bietet eine optimierte Infrastruktur für das umfangreiche Training und die Feinabstimmung offener Modelle.
vLLM mit TPUs
Gemma 4 auf Google Cloud TPUs bereitstellen, um eine optimale Bereitstellungsleistung zu erzielen.
MaxText
Gemma 4 wird in MaxText unterstützt, einer leistungsstarken, beliebig großen JAX-LLM-Implementierung für Google Cloud TPUs.
Sovereign Cloud
Gemma 4 ist in Sovereign Cloud-Lösungen verfügbar und bietet so mehr Kontrolle und Compliance für sensible Arbeitslasten.