Vendosni Gemma me Google Cloud

Platforma Google Cloud ofron shumë mundësi për vendosjen, shërbimin dhe rregullimin e hollësishëm të modeleve të hapura Gemma 4, duke përfshirë sa vijon:

Vertex AI Model Garden

Vertex AI është një platformë Google Cloud për ndërtimin dhe shkallëzimin e shpejtë të projekteve të të mësuarit automatik. Gemma 4 është e disponueshme në Model Garden , një koleksion i kuruar modelesh në Vertex AI. Ju mund të testoni dhe vendosni modele direkt nga konzola.

Për të mësuar më shumë, referojuni faqeve të mëposhtme:

Run në re

Cloud Run është një platformë plotësisht e menaxhuar për të ekzekutuar kodin ose kontejnerët tuaj mbi infrastrukturën shumë të shkallëzueshme të Google. Vendosni Gemma 4 në Cloud Run duke përdorur GPU-të për shkallëzim deri në zero, me pagesë për përdorim.

Për madhësi më të mëdha modalitetesh, shfrytëzoni konfigurimet e përparuara me GPU-të RTX 6000 Pro dhe Model Streaming.

Motori Google Kubernetes (GKE)

Google Kubernetes Engine (GKE) është një shërbim i menaxhuar Kubernetes nga Google Cloud. Ekzekutoni Gemma 4 në GKE për orkestrim kontejnerësh të nivelit të ndërmarrjes. Përdorni TPU dhe GPU për të shërbyer modele me rendiment të lartë dhe vonesë të ulët.

Kompleti i Zhvillimit të Agjentëve (ADK)

Ndërtoni dhe orkestroni agjentë të IA-së me Gemma 4 dhe Agent Development Kit (ADK) . Aftësitë e forta të arsyetimit dhe thirrjes së funksioneve të Gemma 4 e bëjnë atë ideal për rrjedhat e punës agjentike.

Grumbuj Trajnimi Vertex AI (VTC)

Përmirësoni Gemma 4 duke përdorur Grumbuj Trajnimi Vertex AI (VTC) . VTC ofron infrastrukturë të optimizuar për trajnim në shkallë të gjerë dhe përshtatje të imët të modeleve të hapura.

vLLM me TPU

Shërbejeni Gemma 4 në TPU-të e Google Cloud për performancë shërbimi të nivelit të lartë.

Teksti maksimal

Gemma 4 mbështetet në MaxText , një implementim JAX LLM me performancë të lartë dhe madhësi arbitrare për TPU-të e Google Cloud.

Reja Sovrane

Gemma 4 është i disponueshëm në zgjidhjet Sovereign Cloud , duke ofruar kontroll dhe pajtueshmëri të përmirësuar për ngarkesa pune të ndjeshme.