Implementa Gemma con Google Cloud

La plataforma de Google Cloud ofrece muchas opciones para implementar, entregar y ajustar los modelos abiertos de Gemma 4, incluidas las siguientes:

Gemini Enterprise Agent Platform

Gemini Enterprise Agent Platform es una plataforma de Google Cloud para crear y escalar rápidamente proyectos de aprendizaje automático. Gemma 4 está disponible en Model Garden, una colección seleccionada de modelos en Gemini Enterprise Agent Platform. Puedes probar e implementar modelos directamente desde la consola.

Para obtener más información, consulta las siguientes páginas:

Cloud Run

Cloud Run es una plataforma completamente administrada para ejecutar tu código o contenedores sobre la infraestructura muy escalable de Google. Implementa Gemma 4 en Cloud Run con GPU para la inferencia de pago por uso y escalabilidad a cero.

Para tamaños de modo más grandes, aprovecha las configuraciones avanzadas con las GPU RTX 6000 Pro y la transmisión de modelos.

Google Kubernetes Engine (GKE)

Google Kubernetes Engine (GKE) es un servicio administrado de Kubernetes de Google Cloud. Ejecuta Gemma 4 en GKE para la organización de contenedores de nivel empresarial. Usa TPU y GPU para entregar modelos con un alto rendimiento y una baja latencia.

Kit de desarrollo de agentes (ADK)

Crea y organiza agentes de IA con Gemma 4 y el Kit de desarrollo de agentes (ADK). Las sólidas capacidades de razonamiento y llamada a funciones de Gemma 4 lo hacen ideal para los flujos de trabajo de agentes.

Clústeres de entrenamiento de Gemini Enterprise Agent Platform

Ajusta Gemma 4 con los clústeres de entrenamiento de Gemini Enterprise Agent Platform. Los clústeres de entrenamiento proporcionan una infraestructura optimizada para el entrenamiento y el ajuste a gran escala de modelos abiertos.

vLLM con TPU

Entrega Gemma 4 en las TPU de Google Cloud para obtener un rendimiento de entrega de vanguardia

MaxText

Gemma 4 es compatible con MaxText, una implementación de LLM de JAX de alto rendimiento y tamaño arbitrario para las TPU de Google Cloud.

Sovereign Cloud

Gemma 4 está disponible en las soluciones de Sovereign Cloud, lo que proporciona un mayor control y cumplimiento para las cargas de trabajo sensibles.