Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
Google Kubernetes Engine (GKE) es
un servicio administrado de Kubernetes de Google Cloud que
que puedes usar para implementar y operar aplicaciones alojadas en contenedores a gran escala con
la infraestructura de Google. Puedes entregar Gemma con unidades de procesamiento de Cloud Tensor.
(TPU) y unidades de procesamiento gráfico (GPU) en GKE con la entrega de estos LLM
marcos de trabajo:
Con la entrega de Gemma en GKE, puedes implementar una inferencia sólida y lista para la producción
solución de entrega con todos los beneficios de Kubernetes administrado, como
escalabilidad eficiente y alta disponibilidad.
Para obtener más información, consulta las siguientes páginas: