Wdrażanie Gemma w Google Cloud

Platforma Google Cloud oferuje wiele opcji wdrażania, udostępniania i dostrajania otwartych modeli Gemma 4, w tym:

Platforma agentów Gemini Enterprise

Gemini Enterprise Agent Platform to platforma Google Cloud, która umożliwia szybkie tworzenie i skalowanie projektów uczenia maszynowego. Model Gemma 4 jest dostępny w Model Garden, czyli wyselekcjonowanej kolekcji modeli na platformie Gemini Enterprise Agent Platform. Modele możesz testować i wdrażać bezpośrednio z konsoli.

Więcej informacji znajdziesz na tych stronach:

Cloud Run

Cloud Run to w pełni zarządzana platforma do uruchamiania kodu lub kontenerów w infrastrukturze Google o wysokiej skalowalności. Wdrażaj Gemma 4 w Cloud Run, korzystając z GPU, aby skalować do zera i płacić za wykorzystanie wnioskowania.

W przypadku większych rozmiarów modeli skorzystaj z zaawansowanych konfiguracji z kartami graficznymi RTX 6000 Pro i strumieniowaniem modeli.

Google Kubernetes Engine (GKE)

Google Kubernetes Engine (GKE) to zarządzana usługa Kubernetes od Google Cloud. Uruchom model Gemma 4 w GKE, aby korzystać z orkiestracji kontenerów klasy korporacyjnej. Używaj TPU i GPU do udostępniania modeli z wysoką przepustowością i krótkimi czasami oczekiwania.

Pakiet Agent Development Kit (ADK)

Twórz agentów AI i zarządzaj nimi za pomocą modelu Gemma 4 i pakietu Agent Development Kit (ADK). Dzięki zaawansowanym możliwościom rozumowania i wywoływania funkcji model Gemma 4 idealnie nadaje się do przepływów pracy opartych na agentach.

Klastry do trenowania w Gemini Enterprise Agent Platform

Dostrajanie modelu Gemma 4 za pomocą klastrów szkoleniowych Gemini Enterprise Agent Platform Klastry trenowania zapewniają zoptymalizowaną infrastrukturę do trenowania i dostrajania modeli otwartych na dużą skalę.

vLLM z TPU

Udostępniaj model Gemma 4 w jednostkach Cloud TPU od Google Cloud, aby uzyskać najnowocześniejszą wydajność.

MaxText

Model Gemma 4 jest obsługiwany w MaxText, czyli wydajnej implementacji JAX LLM o dowolnym rozmiarze na potrzeby jednostek TPU Google Cloud.

Chmura suwerenna

Model Gemma 4 jest dostępny w ramach rozwiązań Sovereign Cloud, które zapewniają większą kontrolę i zgodność w przypadku wrażliwych zbiorów zadań.