Google AI Studio की मदद से, Gemma 3 को Cloud Run पर डिप्लॉय करना

इस गाइड में, Google AI Studio में एक ही क्लिक से, Cloud Run पर Gemma 3 के ओपन मॉडल को डिप्लॉय करने का तरीका बताया गया है.

Google AI Studio, ब्राउज़र पर आधारित एक प्लैटफ़ॉर्म है. इसकी मदद से, मॉडल तुरंत आज़माए जा सकते हैं और अलग-अलग प्रॉम्प्ट के साथ प्रयोग किए जा सकते हैं. चुने गए Gemma 3 मॉडल का इस्तेमाल करने वाले प्रोटोटाइप वेब ऐप्लिकेशन को डिज़ाइन करने के लिए चैट प्रॉम्प्ट डालने के बाद, जीपीयू की सुविधा वाली Cloud Run सेवा पर Gemma मॉडल को चलाने के लिए, Cloud Run पर डिप्लॉय करें को चुना जा सकता है.

जनरेट की गई फ़्रंट-एंड सेवा को Cloud Run पर डिप्लॉय करने के लिए, Google AI Studio का इस्तेमाल करने पर, आपको कंटेनर तैयार करने के ज़्यादातर सेटअप चरणों को छोड़ना पड़ता है. ऐसा इसलिए, क्योंकि Cloud Run पर Gemma के ओपन मॉडल को दिखाने के लिए, Cloud Run एक पहले से तैयार कंटेनर उपलब्ध कराता है. यह कंटेनर, Google Gen AI SDK के साथ काम करता है.

Google AI Studio का इस्तेमाल शुरू करना

इस सेक्शन में, Google AI Studio का इस्तेमाल करके Gemma 3 को Cloud Run पर डिप्लॉय करने का तरीका बताया गया है.

  1. Google AI Studio में कोई Gemma मॉडल चुनें.

    Google AI Studio पर जाएं

    Chat पेज पर, रन सेटिंग पैनल में, डिफ़ॉल्ट Gemma मॉडल का इस्तेमाल करें या Gemma मॉडल में से कोई एक चुनें.

  2. सबसे ऊपर मौजूद बार में, ज़्यादा कार्रवाइयां देखें चुनें और Cloud Run पर डिप्लॉय करें पर क्लिक करें.

  3. Google Cloud Run पर Gemma 3 को डिप्लॉय करें डायलॉग में, Google Cloud का नया प्रोजेक्ट बनाने के लिए निर्देशों का पालन करें या कोई मौजूदा प्रोजेक्ट चुनें. अगर कोई बिलिंग खाता नहीं जुड़ा है, तो आपको बिलिंग चालू करने के लिए कहा जा सकता है.

  4. Google AI Studio आपके प्रोजेक्ट की पुष्टि करने के बाद, Google Cloud पर डिप्लॉय करें पर क्लिक करें.

  5. Gemma 3 मॉडल को Google Cloud पर डिप्लॉय करने के बाद, डायलॉग बॉक्स में यह जानकारी दिखती है:

    • Gemma 3 और Ollama पर चल रही आपकी Cloud Run सेवा का Cloud Run एंडपॉइंट यूआरएल.
    • जनरेट किया गया एपीआई पासकोड, जिसका इस्तेमाल Gemini API लाइब्रेरी के साथ पुष्टि करने के लिए किया जाता है. इस कुंजी को डिप्लॉय की गई Cloud Run सेवा के एनवायरमेंट वैरिएबल के तौर पर कॉन्फ़िगर किया जाता है, ताकि आने वाले अनुरोधों को अनुमति दी जा सके. हमारा सुझाव है कि आप IAM पुष्टि करने की सुविधा का इस्तेमाल करने के लिए, एपीआई पासकोड में बदलाव करें. ज़्यादा जानकारी के लिए, Google Gen AI SDK टूल के साथ सुरक्षित तरीके से इंटरैक्ट करना लेख पढ़ें.
    • Google Cloud Console में Cloud Run सेवा का लिंक. अपनी Cloud Run सेवा के लिए डिफ़ॉल्ट कॉन्फ़िगरेशन सेटिंग के बारे में जानने के लिए, लिंक पर जाएं. इसके बाद, कॉन्फ़िगरेशन सेटिंग देखने या उनमें बदलाव करने के लिए, बदलाव करें और नया रिविज़न डिप्लॉय करें को चुनें.
  6. Cloud Run सेवा बनाने के लिए इस्तेमाल किया गया Gemini API का सैंपल कोड देखने के लिए, कोड पाएं चुनें.

  7. ज़रूरी नहीं: कोड को कॉपी करें और ज़रूरत के हिसाब से उसमें बदलाव करें.

अपने कोड की मदद से, डिप्लॉय किए गए Cloud Run एंडपॉइंट और एपीआई पासकोड का इस्तेमाल, Google Gen AI SDK के साथ किया जा सकता है.

उदाहरण के लिए, अगर Python के लिए Google Gen AI SDK टूल का इस्तेमाल किया जा रहा है, तो Python कोड इस तरह दिख सकता है:

from google import genai
from google.genai.types import HttpOptions

# Configure the client to use your Cloud Run endpoint and API key
client = genai.Client(api_key="<YOUR_API_KEY>", http_options=HttpOptions(base_url="<cloud_run_url>"))


# Example: Generate content (non-streaming)
response = client.models.generate_content(
   model="<model>", # Replace model with the Gemma 3 model you selected in Google AI Studio, such as "gemma-3-1b-it".
   contents=["How does AI work?"]
)
print(response.text)


# Example: Stream generate content
response = client.models.generate_content_stream(
   model="<model>", # Replace model with the Gemma 3 model you selected in Google AI Studio, such as "gemma-3-1b-it".
   contents=["Write a story about a magic backpack. You are the narrator of an interactive text adventure game."]
)
for chunk in response:
   print(chunk.text, end="")

ज़रूरी बातें

Google AI Studio से Cloud Run सेवा को डिप्लॉय करते समय, इन बातों का ध्यान रखें:

आगे क्या करना है

Google AI Studio से Cloud Run पर डिप्लॉय करते समय, परफ़ॉर्मेंस को सुरक्षित और ऑप्टिमाइज़ करने के सबसे सही तरीकों के बारे में जानें.