Gemma 4 がリリースされました。テキスト、音声、画像の入力に対応し、最大 256, 000 トークンの長いコンテキストウィンドウを備えています。詳細

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Google Cloud で Gemma をデプロイする

Google Cloud プラットフォームには、Gemma 4 オープンモデルのデプロイ、サービング、ファインチューニングを行うためのオプションが多数用意されています。以下に例を示します。

Gemini Enterprise Agent Platform
Cloud Run
Google Kubernetes Engine（GKE）
Agent Development Kit（ADK）
Gemini Enterprise Agent Platform トレーニングクラスタ
MaxText
TPU を使用した vLLM
Sovereign Cloud

Gemini Enterprise Agent Platform

Gemini Enterprise Agent Platform は、機械学習プロジェクトを迅速に構築してスケーリングするための Google Cloud プラットフォームです。Gemma 4 は、Model Garden（Gemini Enterprise Agent Platform のモデルのキュレートされたコレクション）で利用できます。コンソールからモデルを直接テストしてデプロイできます。

詳細については、次のページをご覧ください。

Agent Platform の概要: Gemini Enterprise Agent Platform を使ってみる。
Gemini Enterprise Agent Platform で Gemma を使用する: Gemini Enterprise Agent Platform で Gemma オープンモデルを使用する。

Cloud Run

Cloud Run は、Google のスケーラビリティの高いインフラストラクチャ上でコードまたはコンテナを実行するためのフルマネージドプラットフォームです。GPU を使用して Cloud Run に Gemma 4 をデプロイし、スケールゼロの従量課金制の推論を行います。

モデルサイズが大きい場合は、RTX 6000 Pro GPU とモデルストリーミングを使用して高度な構成を活用します。

Google Kubernetes Engine（GKE）

Google Kubernetes Engine（GKE）は、Google Cloud のマネージド Kubernetes サービスです。エンタープライズグレードのコンテナオーケストレーションのために GKE で Gemma 4 を実行します。 TPU と GPU を使用して、高スループットと低レイテンシでモデルをサービングします。

Agent Development Kit（ADK）

Gemma 4 と Agent Development Kit (ADK) を使用して、AI エージェントを構築してオーケストレートします。Gemma 4 の強力な推論機能と関数呼び出し機能は、エージェントワークフローに最適です。

Gemini Enterprise Agent Platform トレーニングクラスタ

Gemini Enterprise Agent Platform トレーニングクラスタを使用して Gemma 4 をファインチューチュニングします。トレーニングクラスタは、オープンモデルの大規模なトレーニングとファインチューニングに最適化されたインフラストラクチャを提供します。

TPU を使用した vLLM

Google Cloud TPU で Gemma 4 をサービングし、最先端のサービングパフォーマンスを実現します。

MaxText

Gemma 4 は、MaxText（Google Cloud TPU 用の高性能で任意のサイズの JAX LLM 実装）でサポートされています。

Sovereign Cloud

Gemma 4 は Sovereign Cloud ソリューションで利用でき、機密性の高いワークロードの制御とコンプライアンスを強化します。