Google Cloud की मदद से Gemma को डिप्लॉय करना

Google Cloud प्लैटफ़ॉर्म, Gemma 4 के ओपन मॉडल को डिप्लॉय करने, उन्हें इस्तेमाल करने, और उन्हें बेहतर बनाने के लिए कई विकल्प उपलब्ध कराता है. इनमें ये विकल्प शामिल हैं:

Vertex AI Model Garden

Vertex AI, Google Cloud का एक ऐसा प्लैटफ़ॉर्म है जिसकी मदद से, मशीन लर्निंग प्रोजेक्ट को तेज़ी से बनाया और स्केल किया जा सकता है. Gemma 4, Model Garden में उपलब्ध है. यह Vertex AI पर मौजूद मॉडल का एक क्यूरेट किया गया कलेक्शन है. सीधे कंसोल से मॉडल को टेस्ट और डिप्लॉय किया जा सकता है.

ज़्यादा जानने के लिए, इन पेजों पर जाएं:

Cloud Run

Cloud Run, पूरी तरह से मैनेज किया जाने वाला एक प्लैटफ़ॉर्म है. इसकी मदद से, Google के बड़े पैमाने पर इस्तेमाल किए जा सकने वाले इंफ़्रास्ट्रक्चर पर अपना कोड या कंटेनर चलाया जा सकता है. Cloud Run पर Gemma 4 को डिप्लॉय करें और इस्तेमाल के हिसाब से शुल्क चुकाएं. साथ ही, स्केल-टू-ज़ीरो के लिए जीपीयू का इस्तेमाल करें.

बड़े मॉडल के साइज़ के लिए, RTX 6000 Pro GPU और मॉडल स्ट्रीमिंग की मदद से, ऐडवांस कॉन्फ़िगरेशन का फ़ायदा पाएं.

Google Kubernetes Engine (जीकेई)

Google Kubernetes Engine (GKE), Google Cloud की मैनेज की गई Kubernetes सेवा है. एंटरप्राइज़-ग्रेड के कंटेनर ऑर्केस्ट्रेशन के लिए, GKE पर Gemma 4 चलाएं. ज़्यादा थ्रूपुट और कम इंतज़ार के समय वाले मॉडल को दिखाने के लिए, टीपीयू और जीपीयू का इस्तेमाल करें.

एजेंट डेवलपमेंट किट (एडीके)

Gemma 4 और एजेंट डेवलपमेंट किट (एडीके) की मदद से, एआई एजेंट बनाएं और उन्हें मैनेज करें. Gemma 4 में, तार्किक फ़ैसले लेने और फ़ंक्शन कॉल करने की बेहतरीन क्षमताएं हैं. इसलिए, यह एजेंटिक वर्कफ़्लो के लिए सबसे सही मॉडल है.

Vertex AI ट्रेनिंग क्लस्टर (वीटीसी)

Vertex AI ट्रेनिंग क्लस्टर (वीटीसी) का इस्तेमाल करके, Gemma 4 को फ़ाइन-ट्यून करें. वीटीसी, ओपन मॉडल की बड़े पैमाने पर ट्रेनिंग और फ़ाइन-ट्यूनिंग के लिए ऑप्टिमाइज़ किया गया इन्फ़्रास्ट्रक्चर उपलब्ध कराता है.

TPU के साथ vLLM

बेहतरीन परफ़ॉर्मेंस के लिए, Google Cloud TPUs पर Gemma 4 को इस्तेमाल करें.

MaxText

Gemma 4, MaxText में काम करता है. यह Google Cloud TPU के लिए, JAX LLM को लागू करने वाला एक ऐसा टूल है जो बेहतर परफ़ॉर्म करता है और किसी भी साइज़ के डेटा को प्रोसेस कर सकता है.

Sovereign Cloud

Gemma 4, Sovereign Cloud के समाधानों पर उपलब्ध है. इससे संवेदनशील वर्कलोड के लिए बेहतर कंट्रोल और अनुपालन मिलता है.