Gemma را با Google Cloud اجرا کنید

پلتفرم گوگل کلود گزینه‌های زیادی برای استقرار، سرویس‌دهی و تنظیم دقیق مدل‌های باز Gemma 4 ارائه می‌دهد، از جمله موارد زیر:

باغ مدل هوش مصنوعی ورتکس

Vertex AI یک پلتفرم Google Cloud برای ساخت و مقیاس‌بندی سریع پروژه‌های یادگیری ماشین است. Gemma 4 در Model Garden ، مجموعه‌ای منتخب از مدل‌ها در Vertex AI، موجود است. می‌توانید مدل‌ها را مستقیماً از کنسول آزمایش و مستقر کنید.

برای آشنایی بیشتر، به صفحات زیر مراجعه کنید:

اجرای ابری

Cloud Run یک پلتفرم کاملاً مدیریت‌شده برای اجرای کد یا کانتینرهای شما بر روی زیرساخت بسیار مقیاس‌پذیر گوگل است. Gemma 4 را با استفاده از GPUها برای استنتاج مقیاس به صفر و پرداخت به ازای استفاده، روی Cloud Run مستقر کنید .

برای حالت‌های بزرگتر، از پیکربندی‌های پیشرفته با پردازنده‌های گرافیکی RTX 6000 Pro و Model Streaming بهره ببرید .

Google Kubernetes Engine (GKE)

موتور کوبرنتیز گوگل (GKE) یک سرویس کوبرنتیز مدیریت‌شده از گوگل کلود است. Gemma 4 را برای هماهنگ‌سازی کانتینر در سطح سازمانی روی GKE اجرا کنید . از TPUها و GPUها برای ارائه مدل‌هایی با توان عملیاتی بالا و تأخیر کم استفاده کنید.

کیت توسعه عامل (ADK)

با استفاده از Gemma 4 و کیت توسعه عامل (ADK)، عامل‌های هوش مصنوعی را بسازید و هماهنگ کنید. قابلیت‌های قوی استدلال و فراخوانی تابع Gemma 4، آن را برای گردش‌های کاری عامل‌محور ایده‌آل می‌کند.

خوشه‌های آموزشی هوش مصنوعی ورتکس (VTC)

تنظیم دقیق Gemma 4 با استفاده از خوشه‌های آموزشی هوش مصنوعی Vertex (VTC) . VTC زیرساخت بهینه‌ای را برای آموزش در مقیاس بزرگ و تنظیم دقیق مدل‌های باز فراهم می‌کند.

vLLM با TPU

برای عملکرد پیشرفته در ارائه، Gemma 4 را روی TPU های Google Cloud سرو کنید .

مکس تکست

Gemma 4 در MaxText ، یک پیاده‌سازی JAX LLM با کارایی بالا و اندازه دلخواه برای TPUهای Google Cloud، پشتیبانی می‌شود.

ابر مستقل

Gemma 4 در راهکارهای Sovereign Cloud موجود است و کنترل و انطباق بیشتری را برای بارهای کاری حساس فراهم می‌کند.