این راهنما نشان میدهد که چگونه میتوان مدلهای باز Gemma 3 را با یک کلیک در استودیوی Google AI در Cloud Run اجرا کرد.
Google AI Studio یک پلتفرم مبتنی بر مرورگر است که به شما امکان می دهد به سرعت مدل ها را امتحان کنید و با اعلان های مختلف آزمایش کنید. پس از اینکه برای طراحی یک برنامه وب اولیه که از مدل انتخابی Gemma 3 استفاده میکند، درخواست چت را وارد کردید، میتوانید Deploy to Cloud Run را انتخاب کنید تا مدل Gemma در یک سرویس Cloud Run دارای GPU فعال شود.
با استفاده از Google AI Studio برای استقرار یک سرویس front-end تولید شده در Cloud Run، از اکثر مراحل راه اندازی آماده سازی یک ظرف صرفنظر می کنید زیرا Cloud Run یک ظرف از پیش ساخته شده برای ارائه مدل های باز Gemma در Cloud Run ارائه می دهد که از Google Gen AI SDK پشتیبانی می کند.
با Google AI Studio شروع کنید
این بخش شما را از طریق استقرار Gemma 3 در Cloud Run با استفاده از Google AI Studio راهنمایی می کند.
یک مدل Gemma را در Google AI Studio انتخاب کنید.
در پانل تنظیمات Run در صفحه چت ، از مدل پیشفرض Gemma استفاده کنید یا یکی از مدلهای Gemma را انتخاب کنید.
در نوار بالا، View more actions را انتخاب کنید و روی Deploy to Cloud Run کلیک کنید.
در گفتگوی Deploy Gemma 3 در Google Cloud Run ، برای ایجاد یک پروژه Google Cloud جدید، دستورات را دنبال کنید یا یک پروژه موجود را انتخاب کنید. اگر حساب صورتحساب مرتبطی وجود ندارد، ممکن است از شما خواسته شود که صورتحساب را فعال کنید.
بعد از اینکه Google AI Studio پروژه شما را تأیید کرد، روی Deploy to Google Cloud کلیک کنید.
پس از اینکه مدل Gemma 3 با موفقیت در Google Cloud مستقر شد، کادر محاوره ای موارد زیر را نشان می دهد:
- URL نقطه پایانی Cloud Run سرویس Cloud Run شما که Gemma 3 و Ollama را اجرا می کند.
- یک کلید API ایجاد شده که برای احراز هویت با کتابخانههای Gemini API استفاده میشود. این کلید به عنوان یک متغیر محیطی سرویس Cloud Run مستقر شده پیکربندی شده است تا درخواست های دریافتی را مجاز کند. توصیه می کنیم برای استفاده از احراز هویت IAM، کلید API را تغییر دهید. برای جزئیات بیشتر، به تعامل ایمن با Google Gen AI SDK مراجعه کنید.
- پیوندی به سرویس Cloud Run در کنسول Google Cloud. برای اطلاع از تنظیمات پیکربندی پیشفرض برای سرویس Cloud Run خود، به پیوند بروید، سپس ویرایش و استقرار نسخه جدید را انتخاب کنید تا تنظیمات پیکربندی را مشاهده یا تغییر دهید.
برای مشاهده کد نمونه Gemini API که برای ایجاد سرویس Cloud Run استفاده شده است، دریافت کد را انتخاب کنید.
اختیاری: کد را کپی کنید و در صورت نیاز تغییراتی را انجام دهید.
با کد خود، میتوانید از نقطه پایانی Cloud Run و کلید API با Google Gen AI SDK استفاده کنید.
به عنوان مثال، اگر از Google Gen AI SDK برای پایتون استفاده می کنید، کد پایتون ممکن است به صورت زیر باشد:
from google import genai
from google.genai.types import HttpOptions
# Configure the client to use your Cloud Run endpoint and API key
client = genai.Client(api_key="<YOUR_API_KEY>", http_options=HttpOptions(base_url="<cloud_run_url>"))
# Example: Generate content (non-streaming)
response = client.models.generate_content(
model="<model>", # Replace model with the Gemma 3 model you selected in Google AI Studio, such as "gemma-3-1b-it".
contents=["How does AI work?"]
)
print(response.text)
# Example: Stream generate content
response = client.models.generate_content_stream(
model="<model>", # Replace model with the Gemma 3 model you selected in Google AI Studio, such as "gemma-3-1b-it".
contents=["Write a story about a magic backpack. You are the narrator of an interactive text adventure game."]
)
for chunk in response:
print(chunk.text, end="")
ملاحظات
هنگامی که یک سرویس Cloud Run را از Google AI Studio استقرار می دهید، موارد زیر را در نظر بگیرید:
- قیمت گذاری : Cloud Run یک جزء قابل پرداخت است. برای ایجاد تخمین هزینه بر اساس استفاده پیش بینی شده خود، از ماشین حساب قیمت استفاده کنید.
- سهمیه : Cloud Run بهطور خودکار درخواست
Request Total Nvidia L4 GPU allocation, per project per region
تحت API مدیریت Cloud Run ارائه میکند. - App Proxy Server : سرویس مستقر شده از Google AI Studio Gemini App Proxy Server برای بسته بندی Ollama و سازگاری سرویس شما با Gemini API استفاده می کند.
- مجوزها : اگر میخواهید سرویس Cloud Run خود را تغییر دهید، باید نقشهای IAM مورد نیاز را در پروژهتان به حسابتان اعطا کنید.
- احراز هویت : بهطور پیشفرض، وقتی یک سرویس Cloud Run را از Google AI Studio مستقر میکنید، این سرویس با دسترسی عمومی (غیر احراز هویت) (
--allow-unauthenticated
flag) مستقر میشود. برای استفاده از مکانیزم امنیتی قویتر، توصیه میکنیم با IAM احراز هویت کنید.
بعدش چی
هنگام استقرار در Cloud Run از استودیوی هوش مصنوعی Google، با بهترین روشها برای ایمنسازی و بهینهسازی عملکرد آشنا شوید.