پلتفرم گوگل کلود گزینههای زیادی برای استقرار، سرویسدهی و تنظیم دقیق مدلهای باز Gemma 4 ارائه میدهد، از جمله موارد زیر:
- باغ مدل هوش مصنوعی ورتکس
- اجرای ابری
- Google Kubernetes Engine (GKE)
- کیت توسعه عامل (ADK)
- خوشههای آموزشی هوش مصنوعی ورتکس (VTC)
- مکس تکست
- vLLM با TPU
- ابر مستقل
باغ مدل هوش مصنوعی ورتکس
Vertex AI یک پلتفرم Google Cloud برای ساخت و مقیاسبندی سریع پروژههای یادگیری ماشین است. Gemma 4 در Model Garden ، مجموعهای منتخب از مدلها در Vertex AI، موجود است. میتوانید مدلها را مستقیماً از کنسول آزمایش و مستقر کنید.
برای آشنایی بیشتر، به صفحات زیر مراجعه کنید:
- مقدمهای بر هوش مصنوعی ورتکس : شروع کار با هوش مصنوعی ورتکس
- Gemma با Vertex AI : از مدلهای باز Gemma با Vertex AI استفاده کنید.
اجرای ابری
Cloud Run یک پلتفرم کاملاً مدیریتشده برای اجرای کد یا کانتینرهای شما بر روی زیرساخت بسیار مقیاسپذیر گوگل است. Gemma 4 را با استفاده از GPUها برای استنتاج مقیاس به صفر و پرداخت به ازای استفاده، روی Cloud Run مستقر کنید .
برای حالتهای بزرگتر، از پیکربندیهای پیشرفته با پردازندههای گرافیکی RTX 6000 Pro و Model Streaming بهره ببرید .
Google Kubernetes Engine (GKE)
موتور کوبرنتیز گوگل (GKE) یک سرویس کوبرنتیز مدیریتشده از گوگل کلود است. Gemma 4 را برای هماهنگسازی کانتینر در سطح سازمانی روی GKE اجرا کنید . از TPUها و GPUها برای ارائه مدلهایی با توان عملیاتی بالا و تأخیر کم استفاده کنید.
کیت توسعه عامل (ADK)
با استفاده از Gemma 4 و کیت توسعه عامل (ADK)، عاملهای هوش مصنوعی را بسازید و هماهنگ کنید. قابلیتهای قوی استدلال و فراخوانی تابع Gemma 4، آن را برای گردشهای کاری عاملمحور ایدهآل میکند.
خوشههای آموزشی هوش مصنوعی ورتکس (VTC)
تنظیم دقیق Gemma 4 با استفاده از خوشههای آموزشی هوش مصنوعی Vertex (VTC) . VTC زیرساخت بهینهای را برای آموزش در مقیاس بزرگ و تنظیم دقیق مدلهای باز فراهم میکند.
vLLM با TPU
برای عملکرد پیشرفته در ارائه، Gemma 4 را روی TPU های Google Cloud سرو کنید .
مکس تکست
Gemma 4 در MaxText ، یک پیادهسازی JAX LLM با کارایی بالا و اندازه دلخواه برای TPUهای Google Cloud، پشتیبانی میشود.
ابر مستقل
Gemma 4 در راهکارهای Sovereign Cloud موجود است و کنترل و انطباق بیشتری را برای بارهای کاری حساس فراهم میکند.