Platforma Google Cloud udostępnia wiele opcji wdrażania, udostępniania i dostrajania otwartych modeli Gemma 4, w tym:
- Baza modeli Vertex AI
- Cloud Run
- Google Kubernetes Engine (GKE)
- Agent Development Kit (ADK)
- Klastry Vertex AI Training (VTC)
- MaxText
- vLLM z TPU
- Sovereign Cloud
Baza modeli Vertex AI
Vertex AI to platforma Google Cloud, która umożliwia szybkie tworzenie i skalowanie projektów uczenia maszynowego. Gemma 4 jest dostępna w bazie modeli, czyli wyselekcjonowanym zbiorze modeli w Vertex AI. Modele możesz testować i wdrażać bezpośrednio z konsoli.
Więcej informacji znajdziesz na tych stronach:
- Wprowadzenie do Vertex AI: pierwsze kroki z Vertex AI.
- Gemma w Vertex AI: korzystaj z otwartych modeli Gemma w Vertex AI.
Cloud Run
Cloud Run to w pełni zarządzana platforma, która umożliwia uruchamianie kodu lub kontenerów w infrastrukturze Google o wysokiej skalowalności. Wdrażanie Gemma 4 w Cloud Run z użyciem procesorów graficznych do wnioskowania w modelu „skalowanie do zera” i płatności za użycie.
W przypadku większych rozmiarów modeli skorzystaj z zaawansowanych konfiguracji z układami GPU RTX 6000 Pro i strumieniowaniem modeli.
Google Kubernetes Engine (GKE)
Google Kubernetes Engine (GKE) to zarządzana usługa Kubernetes od Google Cloud. Uruchom model Gemma 4 w GKE, aby korzystać z orkiestracji kontenerów klasy korporacyjnej. Używaj TPU i GPU do udostępniania modeli z wysoką przepustowością i niskimi opóźnieniami.
Pakiet Agent Development Kit (ADK)
Tworzenie agentów AI i zarządzanie nimi za pomocą modelu Gemma 4 i pakietu Agent Development Kit (ADK). Dzięki zaawansowanym funkcjom rozumowania i wywoływania funkcji model Gemma 4 idealnie nadaje się do przepływów pracy opartych na agentach.
Klastry Vertex AI Training (VTC)
Dostrajanie modelu Gemma 4 za pomocą klastrów Vertex AI Training (VTC) VTC zapewnia zoptymalizowaną infrastrukturę do trenowania i dostrajania modeli otwartych na dużą skalę.
vLLM z TPU
Udostępniaj model Gemma 4 w jednostkach Google Cloud TPU, aby uzyskać najwyższą wydajność.
MaxText
Model Gemma 4 jest obsługiwany w MaxText, czyli wydajnej implementacji JAX LLM o dowolnym rozmiarze na potrzeby jednostek TPU Google Cloud.
Chmura suwerenna
Model Gemma 4 jest dostępny w rozwiązaniach Sovereign Cloud, co zapewnia większą kontrolę i zgodność w przypadku wrażliwych zbiorów zadań.