Implantar o Gemma com o Google Cloud

A plataforma Google Cloud oferece muitas opções para implantação, disponibilização e ajuste fino de modelos abertos do Gemma 4, incluindo:

Plataforma de agentes do Gemini Enterprise

A Gemini Enterprise Agent Platform é uma plataforma do Google Cloud para criar e escalonar rapidamente projetos de machine learning. A Gemma 4 está disponível no Model Garden, uma coleção selecionada de modelos na Gemini Enterprise Agent Platform. É possível testar e implantar modelos diretamente do console.

Para saber mais, consulte as seguintes páginas:

Cloud Run

O Cloud Run é uma plataforma totalmente gerenciada para executar seu código ou contêineres na infraestrutura altamente escalonável do Google. Implante o Gemma 4 no Cloud Run usando GPUs para redução da escala a zero e inferência de pagamento por uso.

Para tamanhos de modo maiores, use configurações avançadas com GPUs RTX 6000 Pro e streaming de modelos.

Google Kubernetes Engine (GKE)

O Google Kubernetes Engine (GKE) é um serviço gerenciado do Kubernetes do Google Cloud. Execute o Gemma 4 no GKE para orquestração de contêineres de nível empresarial. Use TPUs e GPUs para veicular modelos com alta capacidade de processamento e baixa latência.

Kit de Desenvolvimento de Agente (ADK)

Crie e organize agentes de IA com o Gemma 4 e o Kit de Desenvolvimento de Agente (ADK). O raciocínio avançado e os recursos de chamada de função do Gemma 4 o tornam ideal para fluxos de trabalho com agentes.

Clusters de treinamento da Gemini Enterprise Agent Platform

Ajuste o Gemma 4 usando os clusters de treinamento da plataforma de agentes do Gemini Enterprise. Os clusters de treinamento oferecem infraestrutura otimizada para treinamento e ajuste de modelos abertos em grande escala.

vLLM com TPUs

Disponibilize o Gemma 4 em TPUs do Google Cloud para ter o melhor desempenho de disponibilização.

MaxText

O Gemma 4 é compatível com o MaxText, uma implementação de LLM JAX de alto desempenho e tamanho arbitrário para TPUs do Google Cloud.

Nuvem soberana

A Gemma 4 está disponível nas soluções do Sovereign Cloud, oferecendo controle e compliance aprimorados para cargas de trabalho sensíveis.