La plataforma de Google Cloud ofrece muchas opciones para implementar, entregar y ajustar los modelos abiertos de Gemma 4, incluidas las siguientes:
- Vertex AI Model Garden
- Cloud Run
- Google Kubernetes Engine (GKE)
- Kit de desarrollo de agentes (ADK)
- Clústeres de Vertex AI Training (VTC)
- MaxText
- vLLM con TPU
- Sovereign Cloud
Vertex AI Model Garden
Vertex AI es una plataforma de Google Cloud para compilar y escalar rápidamente proyectos de aprendizaje automático. Gemma 4 está disponible en Model Garden, una colección seleccionada de modelos en Vertex AI. Puedes probar y, luego, implementar modelos directamente desde la consola.
Para obtener más información, consulta las siguientes páginas:
- Introducción a Vertex AI: Comienza a usar Vertex AI.
- Gemma con Vertex AI: Usa modelos abiertos de Gemma con Vertex AI.
Cloud Run
Cloud Run es una plataforma completamente administrada para ejecutar tu código o contenedores sobre la infraestructura muy escalable de Google. Implementa Gemma 4 en Cloud Run con GPU para la inferencia de pago por uso y escalabilidad a cero.
Para tamaños de modo más grandes, aprovecha las configuraciones avanzadas con las GPU RTX 6000 Pro y la transmisión de modelos.
Google Kubernetes Engine (GKE)
Google Kubernetes Engine (GKE) es un servicio administrado de Kubernetes de Google Cloud. Ejecuta Gemma 4 en GKE para la organización de contenedores de nivel empresarial. Usa TPU y GPU para entregar modelos con alta capacidad de procesamiento y baja latencia.
Kit de desarrollo de agentes (ADK)
Compila y organiza agentes de IA con Gemma 4 y el Kit de desarrollo de agentes (ADK). Las sólidas capacidades de razonamiento y de llamada a funciones de Gemma 4 lo hacen ideal para flujos de trabajo de agentes.
Clústeres de Vertex AI Training (VTC)
Ajusta Gemma 4 con los clústeres de Vertex AI Training (VTC). VTC proporciona una infraestructura optimizada para el entrenamiento y el ajuste a gran escala de modelos abiertos.
vLLM con TPU
Entrega Gemma 4 en las TPU de Google Cloud para obtener un rendimiento de entrega de vanguardia.
MaxText
Gemma 4 es compatible con MaxText, una implementación de LLM de JAX de alto rendimiento, tamaño arbitrario para las TPU de Google Cloud.
Sovereign Cloud
Gemma 4 está disponible en las soluciones de Sovereign Cloud, lo que proporciona un mayor control y cumplimiento para las cargas de trabajo sensibles.