Déployer Gemma avec Google Cloud

La plate-forme Google Cloud offre de nombreuses options pour déployer, diffuser et affiner les modèles ouverts Gemma 4, y compris les suivantes :

Gemini Enterprise Agent Platform

Gemini Enterprise Agent Platform est une plate-forme Google Cloud qui permet de créer et de faire évoluer rapidement des projets de machine learning. Gemma 4 est disponible dans Model Garden, une collection de modèles sélectionnés sur Gemini Enterprise Agent Platform. Vous pouvez tester et déployer des modèles directement depuis la console.

Pour en savoir plus, consultez les pages suivantes :

Cloud Run

Cloud Run est une plate-forme entièrement gérée qui permet d'exécuter votre code ou vos conteneurs sur l'infrastructure hautement évolutive de Google. Déployez Gemma 4 sur Cloud Run en utilisant des GPU pour l'inférence à l'échelle zéro et au paiement à l'utilisation.

Pour les tailles de mode plus importantes, utilisez des configurations avancées avec les GPU RTX 6000 Pro et le streaming de modèles.

Google Kubernetes Engine (GKE)

Google Kubernetes Engine (GKE) est un service Kubernetes géré de Google Cloud. Exécutez Gemma 4 sur GKE pour une orchestration de conteneurs de niveau entreprise. Utilisez des TPU et des GPU pour diffuser des modèles avec un débit élevé et une faible latence.

Agent Development Kit (ADK)

Créez et orchestrez des agents IA avec Gemma 4 et l'Agent Development Kit (ADK). Les solides capacités de raisonnement et d'appel de fonction de Gemma 4 en font un modèle idéal pour les workflows agentiques.

Clusters d'entraînement Gemini Enterprise Agent Platform

Ajustez Gemma 4 à l'aide des clusters d'entraînement Gemini Enterprise Agent Platform. Les clusters d'entraînement fournissent une infrastructure optimisée pour l'entraînement et l'affinage à grande échelle de modèles ouverts.

vLLM avec des TPU

Diffusez Gemma 4 sur les TPU Google Cloud pour bénéficier de performances de diffusion de pointe.

MaxText

Gemma 4 est compatible avec MaxText, une implémentation JAX LLM hautes performances et de taille arbitraire pour les TPU Google Cloud.

Cloud souverain

Gemma 4 est disponible sur les solutions Sovereign Cloud, ce qui permet de mieux contrôler et de mieux respecter la conformité pour les charges de travail sensibles.