คู่มือนี้แสดงวิธีทำให้โมเดล Gemma 3 แบบเปิดใช้งานได้ใน Cloud Run ด้วยการคลิกเพียงครั้งเดียวใน Google AI Studio
Google AI Studio เป็นแพลตฟอร์มบนเบราว์เซอร์ที่ช่วยให้คุณลองใช้โมเดลและทดลองใช้พรอมต์ต่างๆ ได้อย่างรวดเร็ว หลังจากป้อนพรอมต์การแชทเพื่อออกแบบเว็บแอปต้นแบบที่จะใช้โมเดล Gemma 3 ที่เลือกแล้ว คุณสามารถเลือกทำให้ใช้งานได้ใน Cloud Run เพื่อเรียกใช้โมเดล Gemma ในบริการ Cloud Run ที่เปิดใช้ GPU
เมื่อใช้ Google AI Studio เพื่อทำให้บริการส่วนหน้าซึ่งสร้างขึ้นใช้งานได้ใน Cloud Run คุณจะข้ามขั้นตอนการเตรียมคอนเทนเนอร์ส่วนใหญ่ไปได้เนื่องจาก Cloud Run มีคอนเทนเนอร์ที่สร้างไว้ล่วงหน้าสำหรับแสดงโมเดลแบบเปิดของ Gemma ใน Cloud Run ซึ่งรองรับ Google Gen AI SDK
เริ่มต้นใช้งาน Google AI Studio
ส่วนนี้จะแนะนำวิธีทำให้ Gemma 3 ใช้งานได้ใน Cloud Run โดยใช้ Google AI Studio
เลือกโมเดล Gemma ใน Google AI Studio
ในแผงการตั้งค่าการเรียกใช้ในหน้า Chat ให้ใช้รูปแบบ Gemma เริ่มต้นหรือเลือกรูปแบบ Gemma รูปแบบใดรูปแบบหนึ่ง
ในแถบด้านบน ให้เลือกดูการดำเนินการเพิ่มเติม แล้วคลิกทำให้ใช้งานได้ใน Cloud Run
ในกล่องโต้ตอบทำให้ Gemma 3 ใช้งานได้ใน Google Cloud Run ให้ทำตามข้อความแจ้งเพื่อสร้างโปรเจ็กต์ Google Cloud ใหม่หรือเลือกโปรเจ็กต์ที่มีอยู่ คุณอาจได้รับข้อความแจ้งให้เปิดใช้การเรียกเก็บเงินหากไม่มีบัญชีสำหรับการเรียกเก็บเงินที่เชื่อมโยง
หลังจาก Google AI Studio ยืนยันโปรเจ็กต์แล้ว ให้คลิกทำให้ใช้งานได้ใน Google Cloud
หลังจากติดตั้งใช้งานโมเดล Gemma 3 ใน Google Cloud เรียบร้อยแล้ว กล่องโต้ตอบจะแสดงข้อมูลต่อไปนี้
- URL ของปลายทาง Cloud Run ของบริการ Cloud Run ที่ใช้ Gemma 3 และ Ollama
- คีย์ API ที่สร้างขึ้นซึ่งใช้สำหรับการตรวจสอบสิทธิ์กับไลบรารี Gemini API คีย์นี้ได้รับการกําหนดค่าเป็นตัวแปรสภาพแวดล้อมของบริการ Cloud Run ที่ติดตั้งใช้งานเพื่อให้สิทธิ์คําขอขาเข้า เราขอแนะนำให้คุณแก้ไขคีย์ API เพื่อใช้การตรวจสอบสิทธิ์ IAM โปรดดูรายละเอียดเพิ่มเติมที่หัวข้อโต้ตอบกับ Google Gen AI SDK อย่างปลอดภัย
- ลิงก์ไปยังบริการ Cloud Run ในคอนโซล Google Cloud หากต้องการดูข้อมูลเกี่ยวกับการตั้งค่าการกําหนดค่าเริ่มต้นสําหรับบริการ Cloud Run ให้ไปที่ลิงก์ แล้วเลือกแก้ไขและทําให้การแก้ไขใหม่ใช้งานได้เพื่อดูหรือแก้ไขการตั้งค่าการกําหนดค่า
หากต้องการดูโค้ดตัวอย่าง Gemini API ที่ใช้สร้างบริการ Cloud Run ให้เลือกรับโค้ด
ไม่บังคับ: คัดลอกโค้ดและทำการแก้ไขตามต้องการ
โค้ดนี้จะช่วยให้คุณใช้ปลายทาง Cloud Run และคีย์ API ที่ติดตั้งใช้งานกับ Google Gen AI SDK ได้
ตัวอย่างเช่น หากคุณใช้ Google Gen AI SDK สําหรับ Python โค้ด Python อาจมีลักษณะดังนี้
from google import genai
from google.genai.types import HttpOptions
# Configure the client to use your Cloud Run endpoint and API key
client = genai.Client(api_key="<YOUR_API_KEY>", http_options=HttpOptions(base_url="<cloud_run_url>"))
# Example: Generate content (non-streaming)
response = client.models.generate_content(
model="<model>", # Replace model with the Gemma 3 model you selected in Google AI Studio, such as "gemma-3-1b-it".
contents=["How does AI work?"]
)
print(response.text)
# Example: Stream generate content
response = client.models.generate_content_stream(
model="<model>", # Replace model with the Gemma 3 model you selected in Google AI Studio, such as "gemma-3-1b-it".
contents=["Write a story about a magic backpack. You are the narrator of an interactive text adventure game."]
)
for chunk in response:
print(chunk.text, end="")
ข้อควรพิจารณา
เมื่อคุณติดตั้งใช้งานบริการ Cloud Run จาก Google AI Studio ให้พิจารณาถึงสิ่งต่อไปนี้
- ราคา: Cloud Run เป็นคอมโพเนนต์แบบเรียกเก็บเงิน หากต้องการสร้างต้นทุนโดยประมาณตามการใช้งานที่คาดไว้ ให้ใช้เครื่องคำนวณราคา
- โควต้า: Cloud Run จะส่งคำขอโควต้า
Request Total Nvidia L4 GPU allocation, per project per region
ภายใต้ Cloud Run Admin API โดยอัตโนมัติ - App Proxy Server: บริการที่ติดตั้งใช้งานจะใช้App Proxy Server ของ Gemini ใน Google AI Studio เพื่อรวม Ollama และทําให้บริการของคุณเข้ากันได้กับ Gemini API
- สิทธิ์: หากต้องการแก้ไขบริการ Cloud Run คุณต้องมีบทบาท IAM ที่จำเป็นซึ่งมอบให้กับบัญชีในโปรเจ็กต์
- การตรวจสอบสิทธิ์: โดยค่าเริ่มต้น เมื่อคุณติดตั้งใช้งานบริการ Cloud Run จาก Google AI Studio ระบบจะติดตั้งใช้งานบริการด้วยสิทธิ์เข้าถึงแบบสาธารณะ (ไม่ได้ตรวจสอบสิทธิ์) (Flag
--allow-unauthenticated
) หากต้องการใช้กลไกการรักษาความปลอดภัยที่รัดกุมยิ่งขึ้น เราขอแนะนำให้คุณตรวจสอบสิทธิ์ด้วย IAM
ขั้นตอนถัดไป
ดูข้อมูลเกี่ยวกับแนวทางปฏิบัติแนะนำเพื่อรักษาความปลอดภัยและเพิ่มประสิทธิภาพเมื่อคุณทำให้ใช้งานได้ใน Cloud Run จาก Google AI Studio