Google Kubernetes Engine (GKE) con Gemma

Google Kubernetes Engine (GKE) es un servicio administrado de Kubernetes de Google Cloud que puedes usar para implementar y operar aplicaciones alojadas en contenedores a gran escala con la infraestructura de Google. Puedes entregar Gemma con unidades de procesamiento de Cloud Tensor (TPU) y unidades de procesamiento gráfico (GPU) en GKE con estos frameworks de entrega de LLM:

Mediante la entrega de Gemma en GKE, puedes implementar una solución de inferencia sólida y lista para la producción con todos los beneficios de Kubernetes administrado, incluida una escalabilidad eficiente y una mayor disponibilidad.

Para obtener más información, consulta las siguientes páginas: