يوضّح هذا الدليل كيفية نشر نماذج Gemma 3 المفتوحة على Cloud Run بنقرة واحدة في Google AI Studio.
Google AI Studio هي منصّة مستندة إلى المتصفّح تتيح لك تجربة نماذج بسرعة واستخدام طلبات مختلفة. بعد إدخال طلب محادثة لتصميم نموذج أولي لتطبيق ويب يستخدم نموذج Gemma 3 المحدّد، يمكنك اختيار النشر على Cloud Run لتشغيل نموذج Gemma على خدمة Cloud Run المزوّدة بوحدة معالجة الرسومات.
باستخدام Google AI Studio لنشر خدمة واجهة مستخدم تم إنشاؤها على Cloud Run، يمكنك تخطّي معظم خطوات الإعداد لإعداد حاوية، لأنّ Cloud Run يوفّر حاوية مُنشأة مسبقًا لعرض نماذج Gemma المفتوحة على Cloud Run التي تتوافق مع حزمة تطوير البرامج (SDK) لتكنولوجيات الذكاء الاصطناعي التوليدي من Google.
بدء استخدام Google AI Studio
يرشدك هذا القسم خلال عملية نشر Gemma 3 على Cloud Run باستخدام Google AI Studio.
اختَر نموذج Gemma في Google AI Studio.
في لوحة إعدادات التشغيل في صفحة Chat، استخدِم نموذج Gemma التلقائي أو اختَر أحد نماذج Gemma.
في الشريط العلوي، اختَر عرض المزيد من الإجراءات وانقر على النشر على Cloud Run.
في مربّع الحوار نشر Gemma 3 على Google Cloud Run ، اتّبِع التعليمات لإنشاء مشروع جديد على Google Cloud أو اختَر مشروعًا حاليًا. قد يُطلب منك تفعيل الفوترة في حال عدم توفّر حساب فوترة مرتبط.
بعد أن يتحقّق Google AI Studio من مشروعك، انقر على النشر على Google Cloud.
بعد نشر نموذج Gemma 3 بنجاح على Google Cloud، يعرض مربّع الحوار ما يلي:
- عنوان URL لنقطة نهاية Cloud Run لخدمة Cloud Run التي تعمل بتطبيق Gemma 3 و Ollama
- مفتاح واجهة برمجة تطبيقات تم إنشاؤه ويُستخدَم للمصادقة باستخدام مكتبات Gemini API. يتم ضبط هذا المفتاح على أنّه متغيّر بيئة لخدمة Cloud Run المنشورة لتفويض الطلبات الواردة. ننصح بتعديل مفتاح واجهة برمجة التطبيقات لاستخدام مصادقة إدارة الهوية وإمكانية الوصول. لمزيد من التفاصيل، يُرجى الاطّلاع على مقالة التفاعل بأمان مع حزمة تطوير البرامج (SDK) لتكنولوجيات الذكاء الاصطناعي التوليدي من Google.
- رابط يؤدي إلى خدمة Cloud Run في Google Cloud Console للاطّلاع على إعدادات الضبط التلقائية لخدمة Cloud Run، انتقِل إلى الرابط، ثم اختَر تعديل الإصدار الجديد ونشره لعرض أو تعديل إعدادات الضبط.
لعرض نموذج رمز Gemini API الذي تم استخدامه لإنشاء خدمة Cloud Run، اختَر الحصول على الرمز.
اختياري: انسخ الرمز وأدخِل التعديلات حسب الحاجة.
باستخدام الرمز البرمجي، يمكنك استخدام نقطة نهاية Cloud Run المُنشَأة ومفتاح واجهة برمجة التطبيقات مع Google Gen AI SDK.
على سبيل المثال، إذا كنت تستخدم حزمة تطوير البرامج (SDK) لتكنولوجيات الذكاء الاصطناعي العامة من Google لبرنامج Python، قد يبدو رمز Python على النحو التالي:
from google import genai
from google.genai.types import HttpOptions
# Configure the client to use your Cloud Run endpoint and API key
client = genai.Client(api_key="<YOUR_API_KEY>", http_options=HttpOptions(base_url="<cloud_run_url>"))
# Example: Generate content (non-streaming)
response = client.models.generate_content(
model="<model>", # Replace model with the Gemma 3 model you selected in Google AI Studio, such as "gemma-3-1b-it".
contents=["How does AI work?"]
)
print(response.text)
# Example: Stream generate content
response = client.models.generate_content_stream(
model="<model>", # Replace model with the Gemma 3 model you selected in Google AI Studio, such as "gemma-3-1b-it".
contents=["Write a story about a magic backpack. You are the narrator of an interactive text adventure game."]
)
for chunk in response:
print(chunk.text, end="")
الاعتبارات
عند نشر خدمة Cloud Run من Google AI Studio، ضع في اعتبارك ما يلي:
- الأسعار: Cloud Run هو أحد المكوّنات التي يتم تحصيل رسومها. لإنشاء تقدير للتكلفة استنادًا إلى معدّل الاستخدام المتوقّع، استخدِم حاسبة الأسعار.
- الحصة: تُقدّم Cloud Run تلقائيًا طلبًا للحصول على حصة
Request Total Nvidia L4 GPU allocation, per project per regionضمن واجهة برمجة تطبيقات Cloud Run Admin API. - خادم وكيل التطبيقات: تستخدِم الخدمة المنشورة خادم وكيل التطبيقات Gemini في Google AI Studio لتغليف Ollama وجعل خدمتك متوافقة مع واجهة برمجة التطبيقات Gemini API.
- الأذونات: إذا كنت بحاجة إلى تعديل خدمة Cloud Run، يجب أن يكون لديك أدوار إدارة الهوية وإمكانية الوصول المطلوبة ممنوحة لحسابك في مشروعك.
- المصادقة: عند نشر خدمة Cloud Run من
Google AI Studio، يتم نشر الخدمة تلقائيًا باستخدام
إذن وصول متاح للجميع (غير مُعتمَد)
(علامة
--allow-unauthenticated). لاستخدام آلية أمان أقوى، ننصحك بالمصادقة باستخدام إدارة الهوية وإمكانية الوصول.
الخطوات التالية
اطّلِع على أفضل الممارسات لتأمين الأداء وتحسينه عند النشر على Cloud Run من Google AI Studio.