Google Cloud प्लैटफ़ॉर्म, Gemma 4 के ओपन मॉडल को डिप्लॉय करने, उन्हें इस्तेमाल करने, और उन्हें बेहतर बनाने के लिए कई विकल्प उपलब्ध कराता है. इनमें ये विकल्प शामिल हैं:
- Vertex AI Model Garden
- Cloud Run
- Google Kubernetes Engine (GKE)
- Agent Development Kit (ADK)
- Vertex AI ट्रेनिंग क्लस्टर (वीटीसी)
- MaxText
- TPU के साथ vLLM
- Sovereign Cloud
Vertex AI Model Garden
Vertex AI, Google Cloud का एक ऐसा प्लैटफ़ॉर्म है जिसकी मदद से, मशीन लर्निंग प्रोजेक्ट को तेज़ी से बनाया और स्केल किया जा सकता है. Gemma 4, Model Garden में उपलब्ध है. यह Vertex AI पर मौजूद मॉडल का एक क्यूरेट किया गया कलेक्शन है. सीधे कंसोल से मॉडल को टेस्ट और डिप्लॉय किया जा सकता है.
ज़्यादा जानने के लिए, इन पेजों पर जाएं:
- Vertex AI के बारे में जानकारी: Vertex AI का इस्तेमाल शुरू करें.
- Vertex AI के साथ Gemma: Vertex AI के साथ Gemma के ओपन मॉडल इस्तेमाल करें.
Cloud Run
Cloud Run, पूरी तरह से मैनेज किया जाने वाला एक प्लैटफ़ॉर्म है. इसकी मदद से, Google के बड़े पैमाने पर इस्तेमाल किए जा सकने वाले इंफ़्रास्ट्रक्चर पर अपना कोड या कंटेनर चलाया जा सकता है. Cloud Run पर Gemma 4 को डिप्लॉय करें और इस्तेमाल के हिसाब से शुल्क चुकाएं. साथ ही, स्केल-टू-ज़ीरो के लिए जीपीयू का इस्तेमाल करें.
बड़े मॉडल के साइज़ के लिए, RTX 6000 Pro GPU और मॉडल स्ट्रीमिंग की मदद से, ऐडवांस कॉन्फ़िगरेशन का फ़ायदा पाएं.
Google Kubernetes Engine (जीकेई)
Google Kubernetes Engine (GKE), Google Cloud की मैनेज की गई Kubernetes सेवा है. एंटरप्राइज़-ग्रेड के कंटेनर ऑर्केस्ट्रेशन के लिए, GKE पर Gemma 4 चलाएं. ज़्यादा थ्रूपुट और कम इंतज़ार के समय वाले मॉडल को दिखाने के लिए, टीपीयू और जीपीयू का इस्तेमाल करें.
एजेंट डेवलपमेंट किट (एडीके)
Gemma 4 और एजेंट डेवलपमेंट किट (एडीके) की मदद से, एआई एजेंट बनाएं और उन्हें मैनेज करें. Gemma 4 में, तार्किक फ़ैसले लेने और फ़ंक्शन कॉल करने की बेहतरीन क्षमताएं हैं. इसलिए, यह एजेंटिक वर्कफ़्लो के लिए सबसे सही मॉडल है.
Vertex AI ट्रेनिंग क्लस्टर (वीटीसी)
Vertex AI ट्रेनिंग क्लस्टर (वीटीसी) का इस्तेमाल करके, Gemma 4 को फ़ाइन-ट्यून करें. वीटीसी, ओपन मॉडल की बड़े पैमाने पर ट्रेनिंग और फ़ाइन-ट्यूनिंग के लिए ऑप्टिमाइज़ किया गया इन्फ़्रास्ट्रक्चर उपलब्ध कराता है.
TPU के साथ vLLM
बेहतरीन परफ़ॉर्मेंस के लिए, Google Cloud TPUs पर Gemma 4 को इस्तेमाल करें.
MaxText
Gemma 4, MaxText में काम करता है. यह Google Cloud TPU के लिए, JAX LLM को लागू करने वाला एक ऐसा टूल है जो बेहतर परफ़ॉर्म करता है और किसी भी साइज़ के डेटा को प्रोसेस कर सकता है.
Sovereign Cloud
Gemma 4, Sovereign Cloud के समाधानों पर उपलब्ध है. इससे संवेदनशील वर्कलोड के लिए बेहतर कंट्रोल और अनुपालन मिलता है.