A plataforma Google Cloud oferece muitas opções para implantar, disponibilizar e ajustar modelos abertos do Gemma 4, incluindo:
- Model Garden da Vertex AI
- Cloud Run
- Google Kubernetes Engine (GKE)
- Kit de Desenvolvimento de Agente (ADK)
- Clusters de treinamento da Vertex AI (VTC)
- MaxText
- vLLM com TPUs
- Sovereign Cloud
Model Garden da Vertex AI
A Vertex AI é uma plataforma do Google Cloud para criar e escalonar projetos de machine learning rapidamente. O Gemma 4 está disponível no Model Garden, uma coleção selecionada de modelos na Vertex AI. É possível testar e implantar modelos diretamente do console.
Para saber mais, consulte as seguintes páginas:
- Introdução à Vertex AI: Comece a usar a Vertex AI.
- Gemma com a Vertex AI: Use modelos abertos do Gemma com a Vertex AI.
Cloud Run
O Cloud Run é uma plataforma totalmente gerenciada para executar seu código ou contêineres na infraestrutura altamente escalonável do Google. Implante o Gemma 4 no Cloud Run usando GPUs para inferência com redução da escala a zero e pagamento por uso.
Para tamanhos de modo maiores, aproveite as configurações avançadas com GPUs RTX 6000 Pro e o Model Streaming.
Google Kubernetes Engine (GKE)
O Google Kubernetes Engine (GKE) é um serviço gerenciado do Kubernetes do Google Cloud. Execute o Gemma 4 no GKE para orquestração de contêineres de nível empresarial. Use TPUs e GPUs para disponibilizar modelos com alta capacidade de processamento e baixa latência.
Kit de Desenvolvimento de Agente (ADK)
Crie e orquestre agentes de IA com o Gemma 4 e o Kit de Desenvolvimento de Agente (ADK). Os recursos de raciocínio e chamada de função do Gemma 4 o tornam ideal para fluxos de trabalho de agentes.
Clusters de treinamento da Vertex AI (VTC)
Ajuste o Gemma 4 usando clusters de treinamento da Vertex AI (VTC). O VTC oferece infraestrutura otimizada para treinamento e ajuste em grande escala de modelos abertos.
vLLM com TPUs
Disponibilize o Gemma 4 nas TPUs do Google Cloud para ter desempenho de disponibilização de última geração.
MaxText
O Gemma 4 é compatível com o MaxText, uma implementação de LLM JAX de alto desempenho, tamanho arbitrário para TPUs do Google Cloud.
Sovereign Cloud
O Gemma 4 está disponível nas soluções do Sovereign Cloud, oferecendo controle e conformidade aprimorados para cargas de trabalho sensíveis.