La plataforma de Google Cloud ofrece muchas opciones para implementar, entregar y ajustar los modelos abiertos de Gemma 4, incluidas las siguientes:
- Gemini Enterprise Agent Platform
- Cloud Run
- Google Kubernetes Engine (GKE)
- Kit de desarrollo de agentes (ADK)
- Clústeres de entrenamiento de Gemini Enterprise Agent Platform
- MaxText
- vLLM con TPU
- Sovereign Cloud
Gemini Enterprise Agent Platform
Gemini Enterprise Agent Platform es una plataforma de Google Cloud para crear y escalar rápidamente proyectos de aprendizaje automático. Gemma 4 está disponible en Model Garden, una colección seleccionada de modelos en Gemini Enterprise Agent Platform. Puedes probar e implementar modelos directamente desde la consola.
Para obtener más información, consulta las siguientes páginas:
- Descripción general de Agent Platform: Comienza a usar Gemini Enterprise Agent Platform.
- Gemma con Gemini Enterprise Agent Platform: Usa modelos abiertos de Gemma con Gemini Enterprise Agent Platform.
Cloud Run
Cloud Run es una plataforma completamente administrada para ejecutar tu código o contenedores sobre la infraestructura muy escalable de Google. Implementa Gemma 4 en Cloud Run con GPU para la inferencia de pago por uso y escalabilidad a cero.
Para tamaños de modo más grandes, aprovecha las configuraciones avanzadas con las GPU RTX 6000 Pro y la transmisión de modelos.
Google Kubernetes Engine (GKE)
Google Kubernetes Engine (GKE) es un servicio administrado de Kubernetes de Google Cloud. Ejecuta Gemma 4 en GKE para la organización de contenedores de nivel empresarial. Usa TPU y GPU para entregar modelos con un alto rendimiento y una baja latencia.
Kit de desarrollo de agentes (ADK)
Crea y organiza agentes de IA con Gemma 4 y el Kit de desarrollo de agentes (ADK). Las sólidas capacidades de razonamiento y llamada a funciones de Gemma 4 lo hacen ideal para los flujos de trabajo de agentes.
Clústeres de entrenamiento de Gemini Enterprise Agent Platform
Ajusta Gemma 4 con los clústeres de entrenamiento de Gemini Enterprise Agent Platform. Los clústeres de entrenamiento proporcionan una infraestructura optimizada para el entrenamiento y el ajuste a gran escala de modelos abiertos.
vLLM con TPU
Entrega Gemma 4 en las TPU de Google Cloud para obtener un rendimiento de entrega de vanguardia
MaxText
Gemma 4 es compatible con MaxText, una implementación de LLM de JAX de alto rendimiento y tamaño arbitrario para las TPU de Google Cloud.
Sovereign Cloud
Gemma 4 está disponible en las soluciones de Sovereign Cloud, lo que proporciona un mayor control y cumplimiento para las cargas de trabajo sensibles.