Implantar o Gemma com o Google Cloud

A plataforma Google Cloud oferece muitas opções para implantar, disponibilizar e ajustar modelos abertos do Gemma 4, incluindo:

Model Garden da Vertex AI

A Vertex AI é uma plataforma do Google Cloud para criar e escalonar projetos de machine learning rapidamente. O Gemma 4 está disponível no Model Garden, uma coleção selecionada de modelos na Vertex AI. É possível testar e implantar modelos diretamente do console.

Para saber mais, consulte as seguintes páginas:

Cloud Run

O Cloud Run é uma plataforma totalmente gerenciada para executar seu código ou contêineres na infraestrutura altamente escalonável do Google. Implante o Gemma 4 no Cloud Run usando GPUs para inferência com redução da escala a zero e pagamento por uso.

Para tamanhos de modo maiores, aproveite as configurações avançadas com GPUs RTX 6000 Pro e o Model Streaming.

Google Kubernetes Engine (GKE)

O Google Kubernetes Engine (GKE) é um serviço gerenciado do Kubernetes do Google Cloud. Execute o Gemma 4 no GKE para orquestração de contêineres de nível empresarial. Use TPUs e GPUs para disponibilizar modelos com alta capacidade de processamento e baixa latência.

Kit de Desenvolvimento de Agente (ADK)

Crie e orquestre agentes de IA com o Gemma 4 e o Kit de Desenvolvimento de Agente (ADK). Os recursos de raciocínio e chamada de função do Gemma 4 o tornam ideal para fluxos de trabalho de agentes.

Clusters de treinamento da Vertex AI (VTC)

Ajuste o Gemma 4 usando clusters de treinamento da Vertex AI (VTC). O VTC oferece infraestrutura otimizada para treinamento e ajuste em grande escala de modelos abertos.

vLLM com TPUs

Disponibilize o Gemma 4 nas TPUs do Google Cloud para ter desempenho de disponibilização de última geração.

MaxText

O Gemma 4 é compatível com o MaxText, uma implementação de LLM JAX de alto desempenho, tamanho arbitrário para TPUs do Google Cloud.

Sovereign Cloud

O Gemma 4 está disponível nas soluções do Sovereign Cloud, oferecendo controle e conformidade aprimorados para cargas de trabalho sensíveis.