Google の最先端モデルである Gemini 2.5 Pro 試験運用版が利用可能になりました。詳細

このページは Cloud Translation API によって翻訳されました。

Gemini API でファインチューニングする

少数ショットプロンプトなどのプロンプト設計戦略では、選択できます。ファインチューニングは、モデルのモデルが特定の出力に沿うように支援したり、手順が不十分で一連の例がある場合に、必要があります。

このページでは、Terraform の背後にあるテキストモデルのファインチューニングのコンセプトの概要を Gemini API テキストサービスを使用します。チューニングを始める準備ができたら、ファインチューニングチュートリアルをご覧ください。特定のユースケース向けに LLM をカスタマイズする方法について詳しくは、ML 集中講座の LLM: ファインチューニング、蒸留、プロンプトエンジニアリングをご覧ください。

ファインチューニングの仕組み

ファインチューニングの目的は、特定のタスクに対するモデルのパフォーマンスをさらに改善することです。ファインチューニングは、タスクの例を多数含むトレーニングデータセットをモデルに提供することで行われます。ニッチなタスクの場合は、パフォーマンスの大幅な向上が期待できます。例の数になります。この種のモデルのチューニングは、 教師ありファインチューニング。他の種類のファインチューニングと区別します。

トレーニングデータは、プロンプト入力を含むサンプルとして構造化する必要があります。出力を返します。Google AI Studio でサンプルデータを使用してモデルを直接チューニングすることもできます。目的は、その動作やタスクを示す多くの例をモデルに提供して、目的の動作やタスクを模倣するようモデルに学習させることです。

チューニングジョブを実行すると、モデルは、目的のタスクの実行や目的の動作の学習に必要な情報をエンコードする際に役立つ追加のパラメータを学習します。これらのパラメータは、推論時に使用できます。チューニングジョブの出力は新しいモデルです。これは、新しく学習したパラメータと元のモデルを組み合わせたものです。

データセットを準備する

ファインチューニングを開始する前に、モデルをチューニングするデータセットが必要です。パフォーマンスを最適化するには、データセット内の例が高品質で多様であり、実際の入力と出力を代表するものである必要があります。

形式

データセットに含まれるサンプルは、想定される本番環境のトラフィックと一致していなければなりません。データセットに特定の書式、キーワード、指示、情報が含まれている場合は、本番データも同じ形式にし、同じ指示を含んでいる必要があります。

たとえば、データセットのサンプルに "question:" と "context:" が含まれている場合は、本番環境のトラフィックにも、データセットの例と同じ順序で "question:" と "context:" が含まれるように整形する必要があります。コンテキストを除外すると、モデルはパターンを認識できず、データセットに含まれるサンプルに完全に一致する質問が含まれていても

別の例として、シーケンス内の次の数値を生成するアプリケーションの Python トレーニングデータは次のとおりです。

training_data = [
  {"text_input": "1", "output": "2"},
  {"text_input": "3", "output": "4"},
  {"text_input": "-3", "output": "-2"},
  {"text_input": "twenty two", "output": "twenty three"},
  {"text_input": "two hundred", "output": "two hundred one"},
  {"text_input": "ninety nine", "output": "one hundred"},
  {"text_input": "8", "output": "9"},
  {"text_input": "-98", "output": "-97"},
  {"text_input": "1,000", "output": "1,001"},
  {"text_input": "10,100,000", "output": "10,100,001"},
  {"text_input": "thirteen", "output": "fourteen"},
  {"text_input": "eighty", "output": "eighty one"},
  {"text_input": "one", "output": "two"},
  {"text_input": "three", "output": "four"},
  {"text_input": "seven", "output": "eight"},
]

データセット内の各例にプロンプトまたはプリアンブルを追加すると、チューニング済みモデルのパフォーマンスを向上させることもできます。プロンプトまたはプリアンブルがデータセットに含まれている場合は、推論時にチューニング済みモデルのプロンプトにも含める必要があります。

制限事項

注: Gemini 1.5 Flash のファインチューニングデータセットには次の制限があります。

例ごとの最大入力サイズは 40,000 文字です。
例あたりの最大出力サイズは 5,000 文字です。

トレーニングデータサイズ

わずか 20 個のサンプルでモデルをファインチューニングできます。追加データ一般的に回答の質が向上します。アプリケーションに応じて、100～500 個のサンプルをターゲットにする必要があります。次の表に示すさまざまな一般的なタスク向けにテキストモデルをファインチューニングするための推奨データセットサイズは次のとおりです。

タスク	データセットのサンプル数
分類	100 以上
要約	100 ～ 500 以上
ドキュメントの検索	100 以上

チューニング用データセットをアップロードする

データは、API を使用してインラインで渡すか、Google AI Studio でアップロードされたファイルから渡します。

クライアントライブラリを使用するには、createTunedModel 呼び出しでデータファイルを指定します。ファイルサイズの上限は 4 MB です。詳しくは、 Python でのファインチューニングのクイックスタートご覧ください。

cURL を使用して REST API を呼び出すには、training_data 引数に JSON 形式のトレーニング例を指定します。開始するには、cURL を使用したチューニングのクイックスタートをご覧ください。

高度なチューニング設定

チューニングジョブを作成するときに、次の詳細設定を指定できます。

エポック: トレーニングセット全体に対するフルトレーニングパス。 1 回だけ処理されています。
バッチサイズ: 1 回のトレーニングの反復処理で使用されるサンプルのセット。バッチサイズによって、バッチ内のサンプル数が決まります。
学習率: 各反復処理でモデルパラメータをどの程度調整するかをアルゴリズムに指示する浮動小数点数。たとえば、学習率が 0.3 の場合、重みとバイアスの調整は学習率が 0.1 の場合の 3 倍強くなります。学習率が高いと低い場合、それぞれに固有のトレードオフがあるため、ユースケースに基づいて調整する必要があります。
学習率の乗数: レートの乗数は、モデルの予測します。値を 1 にすると、元の学習率が使用されます。モデルです。1 より大きい値は学習率を増加させ、1～0 の値は学習率を低下させます。

推奨構成

次の表に、基盤モデルのファインチューニングに推奨される構成を示します。

ハイパーパラメータ	デフォルト値	推奨される調整
エポック	5	5 エポックより前に損失が横ばいし始めた場合は、小さい値を使用します。損失が収束していて、横ばいにならない場合は、値を大きくします。
バッチサイズ	4
学習率	0.001	データセットが小さい場合は、小さい値を使用します。

ハイパーパラメータ

デフォルト値

推奨される調整

エポック

5 エポックより前に損失が横ばいし始めた場合は、小さい値を使用します。

損失が収束していて、横ばいにならない場合は、値を大きくします。

バッチサイズ

学習率

0.001

データセットが小さい場合は、小さい値を使用します。

損失曲線は、各エポック後のトレーニングサンプルにおけるモデルの予測が理想的な予測からどの程度逸脱しているかを示します。理想的には、曲線が横ばいになる直前に、曲線の最下点でトレーニングを停止します。たとえば下のグラフはエポック 4 ～ 6 点で損失曲線が横ばい状態になっていることを表しています。 Epoch パラメータを 4 に設定しても、同じパフォーマンスが得られます。

モデルの損失曲線を示す折れ線グラフ。1 回目と 2 回目のエポック間で線が急増し、その後急激に減少してほぼ 0 になり、3 回目のエポック後に横ばいになります。

チューニングジョブのステータスを確認する

チューニングジョブのステータスは、Google AI Studio の [マイライブラリ] タブで確認できます。また、Gemini API でチューニング済みモデルの metadata プロパティを使用して確認することもできます。

エラーのトラブルシューティングを行う

このセクションでは、チューニング済みモデルの作成中に発生する可能性のあるエラーを解決する方法について説明します。

認証

API とクライアントライブラリを使用してチューニングするには認証が必要です。Google Chat では API キー（推奨）または OAuth を使用して認証を設定する認証情報を取得できます。API キーの設定に関するドキュメントについては、以下をご覧ください。 API キーを設定します。

'PermissionDenied: 403 Request had insufficient authentication scopes' エラーが発生した場合は、OAuth を使用してユーザー認証を設定する必要があります。認証情報を取得できます。Python の OAuth 認証情報を構成するには、OAuth の設定に関するチュートリアルをご覧ください。

キャンセルされたモデル

ファインチューニングジョブは、ジョブが完了する前にいつでもキャンセルできます。ただし、キャンセルされたモデルの推論パフォーマンスは予測できません。特に、チューニングジョブがトレーニングの早い段階でキャンセルされた場合はそうです。次の理由で解約した場合: 以前のエポックでトレーニングを停止する場合は、新しいチューニングエポックを低い値に設定します。

チューニング済みモデルの制限事項

注: チューニング済みモデルには次の制限があります。

チューニング済みの Gemini 1.5 Flash モデルの入力上限は 40,000 文字です。
JSON モードは、チューニング済みモデルではサポートされていません。
テキスト入力のみがサポートされています。

次のステップ

ファインチューニングのチュートリアルを開始する: