Gemma 4 wurde veröffentlicht und unterstützt Text-, Audio- und Bildeingaben sowie ein langes Kontextfenster mit bis zu 256.000 Tokens. Weitere Informationen

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemma mit Google Cloud bereitstellen

Die Google Cloud-Plattform bietet viele Optionen zum Bereitstellen, Bereitstellen und Feinabstimmen von offenen Gemma 4-Modellen, darunter die folgenden:

Gemini Enterprise Agent Platform
Cloud Run
Google Kubernetes Engine (GKE)
Agent Development Kit (ADK)
Gemini Enterprise Agent Platform-Trainingscluster
MaxText
vLLM mit TPUs
Sovereign Cloud

Gemini Enterprise Agent Platform

Die Gemini Enterprise Agent Platform ist eine Google Cloud-Plattform zum schnellen Erstellen und Skalieren von Projekten für maschinelles Lernen. Gemma 4 ist im Model Garden verfügbar, einer kuratierten Sammlung von Modellen auf der Gemini Enterprise Agent Platform. Sie können Modelle direkt über die Konsole testen und bereitstellen.

Weitere Informationen finden Sie auf den folgenden Seiten:

Übersicht über die Agent Platform: Erste Schritte mit der Gemini Enterprise Agent Platform.
Gemma mit Gemini Enterprise Agent Platform: Verwenden Sie offene Gemma-Modelle mit der Gemini Enterprise Agent Platform.

Cloud Run

Cloud Run ist eine vollständig verwaltete Plattform, mit der Sie Code oder Container auf der hoch skalierbaren Infrastruktur von Google ausführen können. Gemma 4 in Cloud Run bereitstellen und GPUs für die Scale-to-Zero-Inferenz mit nutzungsbasierter Abrechnung verwenden.

Bei größeren Modellgrößen können Sie erweiterte Konfigurationen mit RTX 6000 Pro-GPUs und Model Streaming nutzen.

Google Kubernetes Engine (GKE)

Google Kubernetes Engine (GKE) ist ein verwalteter Kubernetes-Dienst von Google Cloud. Gemma 4 in GKE ausführen für die Containerorchestrierung auf Unternehmensniveau. Verwenden Sie TPUs und GPUs, um Modelle mit hohem Durchsatz und niedriger Latenz bereitzustellen.

Agent Development Kit (ADK)

KI-Agents mit Gemma 4 und dem Agent Development Kit (ADK) erstellen und orchestrieren. Die leistungsstarken Funktionen von Gemma 4 für die Problemlösung und den Funktionsaufruf machen das Modell ideal für agentische Workflows.

Trainingscluster für die Gemini Enterprise Agent Platform

Gemma 4 mit Gemini Enterprise Agent Platform-Trainingsclustern abstimmen Training Clusters bietet eine optimierte Infrastruktur für das Training und die Feinabstimmung von Open-Source-Modellen im großen Maßstab.

vLLM mit TPUs

Gemma 4 auf Google Cloud-TPUs bereitstellen, um eine optimale Bereitstellungsleistung zu erzielen.

MaxText

Gemma 4 wird in MaxText unterstützt, einer leistungsstarken, beliebig großen JAX-LLM-Implementierung für Google Cloud-TPUs.

Sovereign Cloud

Gemma 4 ist für Sovereign Cloud-Lösungen verfügbar und bietet verbesserte Kontrolle und Compliance für sensible Arbeitslasten.