Consultez le dépôt des livres de recettes Gemma pour des exemples de génération et de réglage ! En savoir plus

Cette page a été traduite par l'API Cloud Translation.

Google Kubernetes Engine (GKE) avec Gemma

Google Kubernetes Engine (GKE) un service Kubernetes géré de Google Cloud pour déployer et exploiter des applications conteneurisées à grande échelle l'infrastructure de Google. Vous pouvez inférer Gemma à l'aide d'unités de traitement Cloud Tensor (TPU) et processeurs graphiques (GPU) sur GKE, ces LLM servant frameworks:

En diffusant Gemma sur GKE, vous pouvez implémenter une inférence robuste et prête pour la production d'inférence avec tous les avantages du service Kubernetes géré, y compris une évolutivité efficace et une disponibilité accrue.

Pour en savoir plus, consultez les pages suivantes:

GKE présentation: Premiers pas avec Google Kubernetes Engine (GKE)
Orchestration de l'IA/du ML sur GKE: Exécuter des charges de travail d'IA/de ML optimisées avec GKE