Gemma 4 推出，支援文字、音訊和圖片輸入，脈絡窗口最長可達 25.6 萬個詞元！瞭解詳情

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

使用 Google Cloud 部署 Gemma

Google Cloud 平台提供多種選項，可部署、提供及微調 Gemma 4 開放模型，包括：

Vertex AI Model Garden

Vertex AI 是 Google Cloud 平台，可快速建構及擴展機器學習專案。Gemma 4 現已在 Model Garden 上架，這是 Vertex AI 上的精選模型集合。您可以直接從控制台測試及部署模型。

詳情請參閱下列頁面：

Cloud Run 是全代管平台，可讓您在 Google 高擴充性的基礎架構上執行程式碼或容器。在 Cloud Run 上部署 Gemma 4，使用 GPU 執行推論，並支援將資源調度率降至零及依用量付費。

Google Kubernetes Engine (GKE) 是 Google Cloud 的 Kubernetes 代管服務。在 GKE 上執行 Gemma 4，進行企業級容器自動化調度管理。使用 TPU 和 GPU 提供模型服務，確保高處理量和低延遲。

使用 Gemma 4 和 Agent Development Kit (ADK) 建構及協調 AI 代理。 Gemma 4 具備強大的推論和函式呼叫功能，非常適合用於代理工作流程。

使用 Vertex AI 訓練叢集 (VTC) 微調 Gemma 4。 VTC 提供最佳化基礎架構，可大規模訓練及微調開放模型。

MaxText 支援 Gemma 4，這是適用於 Google Cloud TPU 的高效能任意大小 JAX LLM 實作項目。

Gemma 4 可在 Sovereign Cloud 解決方案中使用，為機密工作負載提供更完善的控管和法規遵循功能。