Gemma 4 u lançua me hyrje teksti, audio dhe imazhi dhe dritare konteksti deri në 256K! Mësoni më shumë

Kjo faqe është përkthyer nga Cloud Translation API.

Vendosni Gemma me Google Cloud

Platforma Google Cloud ofron shumë mundësi për vendosjen, shërbimin dhe rregullimin e hollësishëm të modeleve të hapura Gemma 4, duke përfshirë sa vijon:

Vertex AI Model Garden
Run në re
Motori Google Kubernetes (GKE)
Kompleti i Zhvillimit të Agjentëve (ADK)
Grumbuj Trajnimi Vertex AI (VTC)
Teksti maksimal
vLLM me TPU
Reja Sovrane

Vertex AI Model Garden

Vertex AI është një platformë Google Cloud për ndërtimin dhe shkallëzimin e shpejtë të projekteve të të mësuarit automatik. Gemma 4 është e disponueshme në Model Garden , një koleksion i kuruar modelesh në Vertex AI. Ju mund të testoni dhe vendosni modele direkt nga konzola.

Për të mësuar më shumë, referojuni faqeve të mëposhtme:

Hyrje në Vertex AI : Filloni me Vertex AI.
Gemma me Vertex AI : Përdorni modelet e hapura të Gemma me Vertex AI.

Run në re

Cloud Run është një platformë plotësisht e menaxhuar për të ekzekutuar kodin ose kontejnerët tuaj mbi infrastrukturën shumë të shkallëzueshme të Google. Vendosni Gemma 4 në Cloud Run duke përdorur GPU-të për shkallëzim deri në zero, me pagesë për përdorim.

Për madhësi më të mëdha modalitetesh, shfrytëzoni konfigurimet e përparuara me GPU-të RTX 6000 Pro dhe Model Streaming.

Motori Google Kubernetes (GKE)

Google Kubernetes Engine (GKE) është një shërbim i menaxhuar Kubernetes nga Google Cloud. Ekzekutoni Gemma 4 në GKE për orkestrim kontejnerësh të nivelit të ndërmarrjes. Përdorni TPU dhe GPU për të shërbyer modele me rendiment të lartë dhe vonesë të ulët.

Kompleti i Zhvillimit të Agjentëve (ADK)

Ndërtoni dhe orkestroni agjentë të IA-së me Gemma 4 dhe Agent Development Kit (ADK) . Aftësitë e forta të arsyetimit dhe thirrjes së funksioneve të Gemma 4 e bëjnë atë ideal për rrjedhat e punës agjentike.

Grumbuj Trajnimi Vertex AI (VTC)

Përmirësoni Gemma 4 duke përdorur Grumbuj Trajnimi Vertex AI (VTC) . VTC ofron infrastrukturë të optimizuar për trajnim në shkallë të gjerë dhe përshtatje të imët të modeleve të hapura.

vLLM me TPU

Shërbejeni Gemma 4 në TPU-të e Google Cloud për performancë shërbimi të nivelit të lartë.

Teksti maksimal

Gemma 4 mbështetet në MaxText , një implementim JAX LLM me performancë të lartë dhe madhësi arbitrare për TPU-të e Google Cloud.

Reja Sovrane

Gemma 4 është i disponueshëm në zgjidhjet Sovereign Cloud , duke ofruar kontroll dhe pajtueshmëri të përmirësuar për ngarkesa pune të ndjeshme.