Platforma Google Cloud oferuje wiele opcji wdrażania, udostępniania i dostrajania otwartych modeli Gemma 4, w tym:
- Gemini Enterprise Agent Platform
- Cloud Run
- Google Kubernetes Engine (GKE)
- Agent Development Kit (ADK)
- Klastry szkoleniowe Gemini Enterprise Agent Platform
- MaxText
- vLLM z TPU
- Sovereign Cloud
Platforma agentów Gemini Enterprise
Gemini Enterprise Agent Platform to platforma Google Cloud, która umożliwia szybkie tworzenie i skalowanie projektów uczenia maszynowego. Model Gemma 4 jest dostępny w Model Garden, czyli wyselekcjonowanej kolekcji modeli na platformie Gemini Enterprise Agent Platform. Modele możesz testować i wdrażać bezpośrednio z konsoli.
Więcej informacji znajdziesz na tych stronach:
- Omówienie Agent Platform: zacznij korzystać z Gemini Enterprise Agent Platform.
- Gemma z Gemini Enterprise Agent Platform: używaj otwartych modeli Gemma z Gemini Enterprise Agent Platform.
Cloud Run
Cloud Run to w pełni zarządzana platforma do uruchamiania kodu lub kontenerów w infrastrukturze Google o wysokiej skalowalności. Wdrażaj Gemma 4 w Cloud Run, korzystając z GPU, aby skalować do zera i płacić za wykorzystanie wnioskowania.
W przypadku większych rozmiarów modeli skorzystaj z zaawansowanych konfiguracji z kartami graficznymi RTX 6000 Pro i strumieniowaniem modeli.
Google Kubernetes Engine (GKE)
Google Kubernetes Engine (GKE) to zarządzana usługa Kubernetes od Google Cloud. Uruchom model Gemma 4 w GKE, aby korzystać z orkiestracji kontenerów klasy korporacyjnej. Używaj TPU i GPU do udostępniania modeli z wysoką przepustowością i krótkimi czasami oczekiwania.
Pakiet Agent Development Kit (ADK)
Twórz agentów AI i zarządzaj nimi za pomocą modelu Gemma 4 i pakietu Agent Development Kit (ADK). Dzięki zaawansowanym możliwościom rozumowania i wywoływania funkcji model Gemma 4 idealnie nadaje się do przepływów pracy opartych na agentach.
Klastry do trenowania w Gemini Enterprise Agent Platform
Dostrajanie modelu Gemma 4 za pomocą klastrów szkoleniowych Gemini Enterprise Agent Platform Klastry trenowania zapewniają zoptymalizowaną infrastrukturę do trenowania i dostrajania modeli otwartych na dużą skalę.
vLLM z TPU
Udostępniaj model Gemma 4 w jednostkach Cloud TPU od Google Cloud, aby uzyskać najnowocześniejszą wydajność.
MaxText
Model Gemma 4 jest obsługiwany w MaxText, czyli wydajnej implementacji JAX LLM o dowolnym rozmiarze na potrzeby jednostek TPU Google Cloud.
Chmura suwerenna
Model Gemma 4 jest dostępny w ramach rozwiązań Sovereign Cloud, które zapewniają większą kontrolę i zgodność w przypadku wrażliwych zbiorów zadań.