A plataforma Google Cloud oferece muitas opções para implantação, disponibilização e ajuste fino de modelos abertos do Gemma 4, incluindo:
- Gemini Enterprise Agent Platform
- Cloud Run
- Google Kubernetes Engine (GKE)
- Kit de Desenvolvimento de Agente (ADK)
- Clusters de treinamento da plataforma de agentes do Gemini Enterprise
- MaxText
- vLLM com TPUs
- Sovereign Cloud
Plataforma de agentes do Gemini Enterprise
A Gemini Enterprise Agent Platform é uma plataforma do Google Cloud para criar e escalonar rapidamente projetos de machine learning. A Gemma 4 está disponível no Model Garden, uma coleção selecionada de modelos na Gemini Enterprise Agent Platform. É possível testar e implantar modelos diretamente do console.
Para saber mais, consulte as seguintes páginas:
- Visão geral da plataforma de agentes: comece a usar a Gemini Enterprise Agent Platform.
- Gemma com a Gemini Enterprise Agent Platform: use modelos abertos da Gemma com a Gemini Enterprise Agent Platform.
Cloud Run
O Cloud Run é uma plataforma totalmente gerenciada para executar seu código ou contêineres na infraestrutura altamente escalonável do Google. Implante o Gemma 4 no Cloud Run usando GPUs para redução da escala a zero e inferência de pagamento por uso.
Para tamanhos de modo maiores, use configurações avançadas com GPUs RTX 6000 Pro e streaming de modelos.
Google Kubernetes Engine (GKE)
O Google Kubernetes Engine (GKE) é um serviço gerenciado do Kubernetes do Google Cloud. Execute o Gemma 4 no GKE para orquestração de contêineres de nível empresarial. Use TPUs e GPUs para veicular modelos com alta capacidade de processamento e baixa latência.
Kit de Desenvolvimento de Agente (ADK)
Crie e organize agentes de IA com o Gemma 4 e o Kit de Desenvolvimento de Agente (ADK). O raciocínio avançado e os recursos de chamada de função do Gemma 4 o tornam ideal para fluxos de trabalho com agentes.
Clusters de treinamento da Gemini Enterprise Agent Platform
Ajuste o Gemma 4 usando os clusters de treinamento da plataforma de agentes do Gemini Enterprise. Os clusters de treinamento oferecem infraestrutura otimizada para treinamento e ajuste de modelos abertos em grande escala.
vLLM com TPUs
Disponibilize o Gemma 4 em TPUs do Google Cloud para ter o melhor desempenho de disponibilização.
MaxText
O Gemma 4 é compatível com o MaxText, uma implementação de LLM JAX de alto desempenho e tamanho arbitrário para TPUs do Google Cloud.
Nuvem soberana
A Gemma 4 está disponível nas soluções do Sovereign Cloud, oferecendo controle e compliance aprimorados para cargas de trabalho sensíveis.