La plate-forme Google Cloud offre de nombreuses options pour déployer, diffuser et affiner les modèles ouverts Gemma 4, y compris les suivantes :
- Vertex AI Model Garden
- Cloud Run
- Google Kubernetes Engine (GKE)
- Agent Development Kit (ADK)
- Clusters Vertex AI Training (VTC)
- MaxText
- vLLM avec des TPU
- Cloud souverain
Vertex AI Model Garden
Vertex AI est une plate-forme Google Cloud qui permet de créer et de faire évoluer rapidement des projets de machine learning. Gemma 4 est disponible dans Model Garden, une collection de modèles sélectionnés sur Vertex AI. Vous pouvez tester et déployer des modèles directement depuis la console.
Pour en savoir plus, consultez les pages suivantes :
- Présentation de Vertex AI : commencez à utiliser Vertex AI.
- Gemma avec Vertex AI : utilisez les modèles ouverts Gemma avec Vertex AI.
Cloud Run
Cloud Run est une plate-forme entièrement gérée qui vous permet d'exécuter votre code ou vos conteneurs sur l'infrastructure hautement évolutive de Google. Déployez Gemma 4 sur Cloud Run en utilisant des GPU pour l'inférence à l'échelle zéro et le paiement à l'utilisation.
Pour les modèles de grande taille, utilisez des configurations avancées avec des GPU RTX 6000 Pro et le streaming de modèles.
Google Kubernetes Engine (GKE)
Google Kubernetes Engine (GKE) est un service Kubernetes géré de Google Cloud. Exécutez Gemma 4 sur GKE pour une orchestration de conteneurs de niveau entreprise. Utilisez des TPU et des GPU pour diffuser des modèles avec un débit élevé et une faible latence.
Agent Development Kit (ADK)
Créez et orchestrez des agents IA avec Gemma 4 et l'Agent Development Kit (ADK). Les solides capacités de raisonnement et d'appel de fonction de Gemma 4 en font un modèle idéal pour les workflows agentiques.
Clusters d'entraînement Vertex AI (VTC)
Affiner Gemma 4 à l'aide des clusters Vertex AI Training (VTC) VTC fournit une infrastructure optimisée pour l'entraînement et l'affinage à grande échelle de modèles ouverts.
vLLM avec des TPU
Diffusez Gemma 4 sur les TPU Google Cloud pour bénéficier de performances de diffusion de pointe.
MaxText
Gemma 4 est compatible avec MaxText, une implémentation JAX LLM hautes performances et de taille arbitraire pour les TPU Google Cloud.
Cloud souverain
Gemma 4 est disponible sur les solutions Sovereign Cloud, qui offrent un contrôle et une conformité améliorés pour les charges de travail sensibles.