Platforma Google Cloud ofron shumë mundësi për vendosjen, shërbimin dhe rregullimin e hollësishëm të modeleve të hapura Gemma 4, duke përfshirë sa vijon:
- Vertex AI Model Garden
- Run në re
- Motori Google Kubernetes (GKE)
- Kompleti i Zhvillimit të Agjentëve (ADK)
- Grumbuj Trajnimi Vertex AI (VTC)
- Teksti maksimal
- vLLM me TPU
- Reja Sovrane
Vertex AI Model Garden
Vertex AI është një platformë Google Cloud për ndërtimin dhe shkallëzimin e shpejtë të projekteve të të mësuarit automatik. Gemma 4 është e disponueshme në Model Garden , një koleksion i kuruar modelesh në Vertex AI. Ju mund të testoni dhe vendosni modele direkt nga konzola.
Për të mësuar më shumë, referojuni faqeve të mëposhtme:
- Hyrje në Vertex AI : Filloni me Vertex AI.
- Gemma me Vertex AI : Përdorni modelet e hapura të Gemma me Vertex AI.
Run në re
Cloud Run është një platformë plotësisht e menaxhuar për të ekzekutuar kodin ose kontejnerët tuaj mbi infrastrukturën shumë të shkallëzueshme të Google. Vendosni Gemma 4 në Cloud Run duke përdorur GPU-të për shkallëzim deri në zero, me pagesë për përdorim.
Për madhësi më të mëdha modalitetesh, shfrytëzoni konfigurimet e përparuara me GPU-të RTX 6000 Pro dhe Model Streaming.
Motori Google Kubernetes (GKE)
Google Kubernetes Engine (GKE) është një shërbim i menaxhuar Kubernetes nga Google Cloud. Ekzekutoni Gemma 4 në GKE për orkestrim kontejnerësh të nivelit të ndërmarrjes. Përdorni TPU dhe GPU për të shërbyer modele me rendiment të lartë dhe vonesë të ulët.
Kompleti i Zhvillimit të Agjentëve (ADK)
Ndërtoni dhe orkestroni agjentë të IA-së me Gemma 4 dhe Agent Development Kit (ADK) . Aftësitë e forta të arsyetimit dhe thirrjes së funksioneve të Gemma 4 e bëjnë atë ideal për rrjedhat e punës agjentike.
Grumbuj Trajnimi Vertex AI (VTC)
Përmirësoni Gemma 4 duke përdorur Grumbuj Trajnimi Vertex AI (VTC) . VTC ofron infrastrukturë të optimizuar për trajnim në shkallë të gjerë dhe përshtatje të imët të modeleve të hapura.
vLLM me TPU
Shërbejeni Gemma 4 në TPU-të e Google Cloud për performancë shërbimi të nivelit të lartë.
Teksti maksimal
Gemma 4 mbështetet në MaxText , një implementim JAX LLM me performancë të lartë dhe madhësi arbitrare për TPU-të e Google Cloud.
Reja Sovrane
Gemma 4 është i disponueshëm në zgjidhjet Sovereign Cloud , duke ofruar kontroll dhe pajtueshmëri të përmirësuar për ngarkesa pune të ndjeshme.