Implementa Gemma con Google Cloud

La plataforma de Google Cloud ofrece muchas opciones para implementar, entregar y ajustar los modelos abiertos de Gemma 4, incluidas las siguientes:

Vertex AI Model Garden

Vertex AI es una plataforma de Google Cloud para compilar y escalar rápidamente proyectos de aprendizaje automático. Gemma 4 está disponible en Model Garden, una colección seleccionada de modelos en Vertex AI. Puedes probar y, luego, implementar modelos directamente desde la consola.

Para obtener más información, consulta las siguientes páginas:

Cloud Run

Cloud Run es una plataforma completamente administrada para ejecutar tu código o contenedores sobre la infraestructura muy escalable de Google. Implementa Gemma 4 en Cloud Run con GPU para la inferencia de pago por uso y escalabilidad a cero.

Para tamaños de modo más grandes, aprovecha las configuraciones avanzadas con las GPU RTX 6000 Pro y la transmisión de modelos.

Google Kubernetes Engine (GKE)

Google Kubernetes Engine (GKE) es un servicio administrado de Kubernetes de Google Cloud. Ejecuta Gemma 4 en GKE para la organización de contenedores de nivel empresarial. Usa TPU y GPU para entregar modelos con alta capacidad de procesamiento y baja latencia.

Kit de desarrollo de agentes (ADK)

Compila y organiza agentes de IA con Gemma 4 y el Kit de desarrollo de agentes (ADK). Las sólidas capacidades de razonamiento y de llamada a funciones de Gemma 4 lo hacen ideal para flujos de trabajo de agentes.

Clústeres de Vertex AI Training (VTC)

Ajusta Gemma 4 con los clústeres de Vertex AI Training (VTC). VTC proporciona una infraestructura optimizada para el entrenamiento y el ajuste a gran escala de modelos abiertos.

vLLM con TPU

Entrega Gemma 4 en las TPU de Google Cloud para obtener un rendimiento de entrega de vanguardia.

MaxText

Gemma 4 es compatible con MaxText, una implementación de LLM de JAX de alto rendimiento, tamaño arbitrario para las TPU de Google Cloud.

Sovereign Cloud

Gemma 4 está disponible en las soluciones de Sovereign Cloud, lo que proporciona un mayor control y cumplimiento para las cargas de trabajo sensibles.