جما ۴ با ورودی متن، صدا و تصویر و پنجره متنی با ظرفیت تا ۲۵۶ هزار دلار منتشر شد! اطلاعات بیشتر

این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.

Gemma را با Google Cloud اجرا کنید

پلتفرم گوگل کلود گزینه‌های زیادی برای استقرار، سرویس‌دهی و تنظیم دقیق مدل‌های باز Gemma 4 ارائه می‌دهد، از جمله موارد زیر:

باغ مدل هوش مصنوعی ورتکس
اجرای ابری
Google Kubernetes Engine (GKE)
کیت توسعه عامل (ADK)
خوشه‌های آموزشی هوش مصنوعی ورتکس (VTC)
مکس تکست
vLLM با TPU
ابر مستقل

باغ مدل هوش مصنوعی ورتکس

Vertex AI یک پلتفرم Google Cloud برای ساخت و مقیاس‌بندی سریع پروژه‌های یادگیری ماشین است. Gemma 4 در Model Garden ، مجموعه‌ای منتخب از مدل‌ها در Vertex AI، موجود است. می‌توانید مدل‌ها را مستقیماً از کنسول آزمایش و مستقر کنید.

برای آشنایی بیشتر، به صفحات زیر مراجعه کنید:

مقدمه‌ای بر هوش مصنوعی ورتکس : شروع کار با هوش مصنوعی ورتکس
Gemma با Vertex AI : از مدل‌های باز Gemma با Vertex AI استفاده کنید.

اجرای ابری

Cloud Run یک پلتفرم کاملاً مدیریت‌شده برای اجرای کد یا کانتینرهای شما بر روی زیرساخت بسیار مقیاس‌پذیر گوگل است. Gemma 4 را با استفاده از GPUها برای استنتاج مقیاس به صفر و پرداخت به ازای استفاده، روی Cloud Run مستقر کنید .

برای حالت‌های بزرگتر، از پیکربندی‌های پیشرفته با پردازنده‌های گرافیکی RTX 6000 Pro و Model Streaming بهره ببرید .

Google Kubernetes Engine (GKE)

موتور کوبرنتیز گوگل (GKE) یک سرویس کوبرنتیز مدیریت‌شده از گوگل کلود است. Gemma 4 را برای هماهنگ‌سازی کانتینر در سطح سازمانی روی GKE اجرا کنید . از TPUها و GPUها برای ارائه مدل‌هایی با توان عملیاتی بالا و تأخیر کم استفاده کنید.

کیت توسعه عامل (ADK)

با استفاده از Gemma 4 و کیت توسعه عامل (ADK)، عامل‌های هوش مصنوعی را بسازید و هماهنگ کنید. قابلیت‌های قوی استدلال و فراخوانی تابع Gemma 4، آن را برای گردش‌های کاری عامل‌محور ایده‌آل می‌کند.

خوشه‌های آموزشی هوش مصنوعی ورتکس (VTC)

تنظیم دقیق Gemma 4 با استفاده از خوشه‌های آموزشی هوش مصنوعی Vertex (VTC) . VTC زیرساخت بهینه‌ای را برای آموزش در مقیاس بزرگ و تنظیم دقیق مدل‌های باز فراهم می‌کند.

vLLM با TPU

برای عملکرد پیشرفته در ارائه، Gemma 4 را روی TPU های Google Cloud سرو کنید .

مکس تکست

Gemma 4 در MaxText ، یک پیاده‌سازی JAX LLM با کارایی بالا و اندازه دلخواه برای TPUهای Google Cloud، پشتیبانی می‌شود.

ابر مستقل

Gemma 4 در راهکارهای Sovereign Cloud موجود است و کنترل و انطباق بیشتری را برای بارهای کاری حساس فراهم می‌کند.