Gemma 3 را با Google AI Studio به Cloud Run اجرا کنید

این راهنما نشان می‌دهد که چگونه می‌توان مدل‌های باز Gemma 3 را با یک کلیک در استودیوی Google AI در Cloud Run اجرا کرد.

Google AI Studio یک پلتفرم مبتنی بر مرورگر است که به شما امکان می دهد به سرعت مدل ها را امتحان کنید و با اعلان های مختلف آزمایش کنید. پس از اینکه برای طراحی یک برنامه وب اولیه که از مدل انتخابی Gemma 3 استفاده می‌کند، درخواست چت را وارد کردید، می‌توانید Deploy to Cloud Run را انتخاب کنید تا مدل Gemma در یک سرویس Cloud Run دارای GPU فعال شود.

با استفاده از Google AI Studio برای استقرار یک سرویس front-end تولید شده در Cloud Run، از اکثر مراحل راه اندازی آماده سازی یک ظرف صرفنظر می کنید زیرا Cloud Run یک ظرف از پیش ساخته شده برای ارائه مدل های باز Gemma در Cloud Run ارائه می دهد که از Google Gen AI SDK پشتیبانی می کند.

با Google AI Studio شروع کنید

این بخش شما را از طریق استقرار Gemma 3 در Cloud Run با استفاده از Google AI Studio راهنمایی می کند.

  1. یک مدل Gemma را در Google AI Studio انتخاب کنید.

    به Google AI Studio بروید

    در پانل تنظیمات Run در صفحه چت ، از مدل پیش‌فرض Gemma استفاده کنید یا یکی از مدل‌های Gemma را انتخاب کنید.

  2. در نوار بالا، View more actions را انتخاب کنید و روی Deploy to Cloud Run کلیک کنید.

  3. در گفتگوی Deploy Gemma 3 در Google Cloud Run ، برای ایجاد یک پروژه Google Cloud جدید، دستورات را دنبال کنید یا یک پروژه موجود را انتخاب کنید. اگر حساب صورتحساب مرتبطی وجود ندارد، ممکن است از شما خواسته شود که صورتحساب را فعال کنید.

  4. بعد از اینکه Google AI Studio پروژه شما را تأیید کرد، روی Deploy to Google Cloud کلیک کنید.

  5. پس از اینکه مدل Gemma 3 با موفقیت در Google Cloud مستقر شد، کادر محاوره ای موارد زیر را نشان می دهد:

    • URL نقطه پایانی Cloud Run سرویس Cloud Run شما که Gemma 3 و Ollama را اجرا می کند.
    • یک کلید API ایجاد شده که برای احراز هویت با کتابخانه‌های Gemini API استفاده می‌شود. این کلید به عنوان یک متغیر محیطی سرویس Cloud Run مستقر شده پیکربندی شده است تا درخواست های دریافتی را مجاز کند. توصیه می کنیم برای استفاده از احراز هویت IAM، کلید API را تغییر دهید. برای جزئیات بیشتر، به تعامل ایمن با Google Gen AI SDK مراجعه کنید.
    • پیوندی به سرویس Cloud Run در کنسول Google Cloud. برای اطلاع از تنظیمات پیکربندی پیش‌فرض برای سرویس Cloud Run خود، به پیوند بروید، سپس ویرایش و استقرار نسخه جدید را انتخاب کنید تا تنظیمات پیکربندی را مشاهده یا تغییر دهید.
  6. برای مشاهده کد نمونه Gemini API که برای ایجاد سرویس Cloud Run استفاده شده است، دریافت کد را انتخاب کنید.

  7. اختیاری: کد را کپی کنید و در صورت نیاز تغییراتی را انجام دهید.

با کد خود، می‌توانید از نقطه پایانی Cloud Run و کلید API با Google Gen AI SDK استفاده کنید.

به عنوان مثال، اگر از Google Gen AI SDK برای پایتون استفاده می کنید، کد پایتون ممکن است به صورت زیر باشد:

from google import genai
from google.genai.types import HttpOptions

# Configure the client to use your Cloud Run endpoint and API key
client = genai.Client(api_key="<YOUR_API_KEY>", http_options=HttpOptions(base_url="<cloud_run_url>"))


# Example: Generate content (non-streaming)
response = client.models.generate_content(
   model="<model>", # Replace model with the Gemma 3 model you selected in Google AI Studio, such as "gemma-3-1b-it".
   contents=["How does AI work?"]
)
print(response.text)


# Example: Stream generate content
response = client.models.generate_content_stream(
   model="<model>", # Replace model with the Gemma 3 model you selected in Google AI Studio, such as "gemma-3-1b-it".
   contents=["Write a story about a magic backpack. You are the narrator of an interactive text adventure game."]
)
for chunk in response:
   print(chunk.text, end="")

ملاحظات

هنگامی که یک سرویس Cloud Run را از Google AI Studio استقرار می دهید، موارد زیر را در نظر بگیرید:

  • قیمت گذاری : Cloud Run یک جزء قابل پرداخت است. برای ایجاد تخمین هزینه بر اساس استفاده پیش بینی شده خود، از ماشین حساب قیمت استفاده کنید.
  • سهمیه : Cloud Run به‌طور خودکار درخواست Request Total Nvidia L4 GPU allocation, per project per region تحت API مدیریت Cloud Run ارائه می‌کند.
  • App Proxy Server : سرویس مستقر شده از Google AI Studio Gemini App Proxy Server برای بسته بندی Ollama و سازگاری سرویس شما با Gemini API استفاده می کند.
  • مجوزها : اگر می‌خواهید سرویس Cloud Run خود را تغییر دهید، باید نقش‌های IAM مورد نیاز را در پروژه‌تان به حسابتان اعطا کنید.
  • احراز هویت : به‌طور پیش‌فرض، وقتی یک سرویس Cloud Run را از Google AI Studio مستقر می‌کنید، این سرویس با دسترسی عمومی (غیر احراز هویت) ( --allow-unauthenticated flag) مستقر می‌شود. برای استفاده از مکانیزم امنیتی قوی‌تر، توصیه می‌کنیم با IAM احراز هویت کنید.

بعدش چی

هنگام استقرار در Cloud Run از استودیوی هوش مصنوعی Google، با بهترین روش‌ها برای ایمن‌سازی و بهینه‌سازی عملکرد آشنا شوید.