Gemini 2.0 Flash の思考モード

Gemini 2.0 Flash 思考モードは、回答の一部としてモデルが行う「思考プロセス」を生成するようにトレーニングされた試験運用版モデルです。その結果、Thinking Mode は、ベースの Gemini 2.0 Flash モデルよりも、レスポンスでより強力な推論機能を備えています。

思考モードを使用する

思考モードは、Google AI Studio で試験運用版モデルとして利用できます。また、Gemini API で直接使用することもできます。

Gemini API

Gemini API を呼び出すときにモデルコードを指定します。次に例を示します。

response = client.models.generate_content(
    model='gemini-2.0-flash-thinking-exp', contents='Explain the Pythagorean theorem to a 10-year-old.'
)

モデルコードとして gemini-2.0-flash-thinking-exp または gemini-2.0-flash-thinking-exp-1219 を使用できます。

Google AI Studio

[設定] ペインの [モデル] プルダウン メニューで、Gemini 2.0 Flash Thinking Experimental モデルを選択します。

考え

モデルの考えが返される方法は、Gemini API を直接使用しているか、Google AI Studio を介してリクエストを送信しているかによって異なります。

Gemini API

モデルの思考プロセスは、モデルがレスポンスを生成するときに作成される content.parts リストの最初の要素として返されます。たとえば、次のコードはモデルの思考プロセスのみを出力します。

response = client.models.generate_content(
    model='gemini-2.0-flash-thinking-exp', contents='Solve 3*x^3-5*x=1'
)

Markdown(response.candidates[0].content.parts[0].text)

Gemini API を使用して思考モードを使用する方法の詳細な例については、Colab ノートブックをご覧ください。

Google AI Studio

モデルの思考プロセスは、レスポンス ウィンドウの [考え] パネルに新しいセクションとして返されます。

Google AI Studio の [考え] パネルの例

デフォルトでは、[考え] パネルは閉じられています。[考え] ヘッダーをクリックすると、パネルを展開できます。

返されたレスポンスと異なり、[考え] パネルの内容は Google AI Studio で編集できません。

制限事項

思考モードは試験運用版のモデルであり、次の制限があります。

  • 32,000 個のトークン入力の上限
  • テキストと画像の入力のみ
  • 8,000 トークンの出力上限
  • テキストのみの出力
  • 検索やコード実行などの組み込みツールの使用なし

次のステップ

Colab ノートブックで思考モードを試すことができます。または、Google AI Studio を開いて、モデルにプロンプトを出すこともできます。