Gemma オープンモデル ファミリーには、カスタム生成ソリューションの構築に役立つ、さまざまなモデルサイズ、機能、タスク特化型のバリエーションが含まれています。アプリケーションで Gemma モデルを使用する際にたどることができる主なパスは次のとおりです。
- モデルを選択し、アプリケーションにそのままデプロイする
- モデルを選択し、特定のタスクに合わせて調整してから、アプリケーションにデプロイするか、コミュニティと共有します。
このガイドでは、モデルの選択、機能のテスト、必要に応じて選択したモデルのアプリケーションへのチューニングを行う方法について説明します。
モデルを選択する
このセクションでは、Gemma モデル ファミリーの公式バリアントを理解し、アプリケーションのモデルを選択する方法について説明します。モデル バリアントは、一般的な機能を提供するか、特定のタスクに特化しています。また、さまざまなパラメータ サイズで提供されるため、必要な機能があり、コンピューティング要件を満たすモデルを選択できます。
Gemma モデルのリスト
次の表に、Gemma モデル ファミリーの主なバリアントと、想定されるデプロイ プラットフォームを示します。
| パラメータ サイズ | 入力 | 出力 | バリアント | 基盤 | 目的のプラットフォーム |
|---|---|---|---|---|---|
| 2 億 7,000 万 | テキスト | テキスト | Gemma 3 | モバイル デバイスとシングルボード コンピュータ | |
| 10 億回 | テキスト | テキスト | Gemma 3 | モバイル デバイスとシングルボード コンピュータ | |
| E2B | テキスト、画像、音声 | テキスト | Gemma 3n | モバイル デバイス | |
| 20 億 | テキスト | テキスト | Gemma 2 | モバイル デバイスとノートパソコン | |
| Gemma 1 | |||||
| 30 億 | テキスト、画像 | テキスト | Gemma 2 | デスクトップ コンピュータと小規模サーバー | |
| E4B | テキスト、画像、音声 | テキスト | Gemma 3n | モバイル デバイスとノートパソコン | |
| 40 億 | テキスト、画像 | テキスト | Gemma 3 | デスクトップ コンピュータと小規模サーバー | |
| 70 億人 | テキスト | テキスト | Gemma 1 | デスクトップ コンピュータと小規模サーバー | |
| 90 億 | テキスト | テキスト | Gemma 2 | ハイエンド デスクトップ パソコンとサーバー | |
| 100 億 | テキスト、画像 | テキスト | Gemma 2 | ハイエンド デスクトップ パソコンとサーバー | |
| 120 億 | テキスト、画像 | テキスト | Gemma 3 | ハイエンド デスクトップ パソコンとサーバー | |
| 270 億 | テキスト、画像 | テキスト | Gemma 3 | 大規模なサーバーまたはサーバー クラスタ | |
| テキスト | テキスト | Gemma 2 | |||
| 28B | テキスト、画像 | テキスト | Gemma 2 | 大規模なサーバーまたはサーバー クラスタ |
Gemma モデル ファミリーには、ShieldGemma、DataGemma、Gemma Scope、Gemma-APS などの特殊用途モデルと研究モデルも含まれています。
モデルをテストする
Gemma モデルをテストするには、ダウンロードしたモデルとサポート ソフトウェアを使用して開発環境を設定します。その後、モデルにプロンプトを入力して、レスポンスを評価できます。次のいずれかの Python ノートブックと、お好みの ML フレームワークを使用して、テスト環境を設定し、Gemma モデルをプロンプトします。
モデルをチューニングする
Gemma モデルをチューニングすることで、その動作を変更できます。モデルをチューニングするには、モデルの動作をガイドするのに十分なサイズとバリエーションの入力と想定されるレスポンスのデータセットが必要です。また、テキスト生成に Gemma モデルを実行する場合と比較して、チューニング実行を完了するには、大幅に多くのコンピューティング リソースとメモリリソースが必要です。次のいずれかの Python ノートブックを使用して、チューニング開発環境を設定し、Gemma モデルをチューニングします。
次のステップ
Gemma を使用してソリューションを構築する方法については、次のガイドをご覧ください。