Wdrażanie Gemma w Google Cloud

Platforma Google Cloud udostępnia wiele opcji wdrażania, udostępniania i dostrajania otwartych modeli Gemma 4, w tym:

Baza modeli Vertex AI

Vertex AI to platforma Google Cloud, która umożliwia szybkie tworzenie i skalowanie projektów uczenia maszynowego. Gemma 4 jest dostępna w bazie modeli, czyli wyselekcjonowanym zbiorze modeli w Vertex AI. Modele możesz testować i wdrażać bezpośrednio z konsoli.

Więcej informacji znajdziesz na tych stronach:

Cloud Run

Cloud Run to w pełni zarządzana platforma, która umożliwia uruchamianie kodu lub kontenerów w infrastrukturze Google o wysokiej skalowalności. Wdrażanie Gemma 4 w Cloud Run z użyciem procesorów graficznych do wnioskowania w modelu „skalowanie do zera” i płatności za użycie.

W przypadku większych rozmiarów modeli skorzystaj z zaawansowanych konfiguracji z układami GPU RTX 6000 Pro i strumieniowaniem modeli.

Google Kubernetes Engine (GKE)

Google Kubernetes Engine (GKE) to zarządzana usługa Kubernetes od Google Cloud. Uruchom model Gemma 4 w GKE, aby korzystać z orkiestracji kontenerów klasy korporacyjnej. Używaj TPU i GPU do udostępniania modeli z wysoką przepustowością i niskimi opóźnieniami.

Pakiet Agent Development Kit (ADK)

Tworzenie agentów AI i zarządzanie nimi za pomocą modelu Gemma 4 i pakietu Agent Development Kit (ADK). Dzięki zaawansowanym funkcjom rozumowania i wywoływania funkcji model Gemma 4 idealnie nadaje się do przepływów pracy opartych na agentach.

Klastry Vertex AI Training (VTC)

Dostrajanie modelu Gemma 4 za pomocą klastrów Vertex AI Training (VTC) VTC zapewnia zoptymalizowaną infrastrukturę do trenowania i dostrajania modeli otwartych na dużą skalę.

vLLM z TPU

Udostępniaj model Gemma 4 w jednostkach Google Cloud TPU, aby uzyskać najwyższą wydajność.

MaxText

Model Gemma 4 jest obsługiwany w MaxText, czyli wydajnej implementacji JAX LLM o dowolnym rozmiarze na potrzeby jednostek TPU Google Cloud.

Chmura suwerenna

Model Gemma 4 jest dostępny w rozwiązaniach Sovereign Cloud, co zapewnia większą kontrolę i zgodność w przypadku wrażliwych zbiorów zadań.