Gemini 2.0 Flash 思考モードは、回答の一部としてモデルが行う「思考プロセス」を生成するようにトレーニングされた試験運用版モデルです。その結果、Thinking Mode は、ベースの Gemini 2.0 Flash モデルよりも、レスポンスでより強力な推論機能を備えています。
思考モードを使用する
思考モードは、Google AI Studio で試験運用版モデルとして利用できます。また、Gemini API で直接使用することもできます。
Gemini API
Gemini API を呼び出すときにモデルコードを指定します。次に例を示します。
response = client.models.generate_content(
model='gemini-2.0-flash-thinking-exp', contents='Explain the Pythagorean theorem to a 10-year-old.'
)
モデルコードとして gemini-2.0-flash-thinking-exp
または gemini-2.0-flash-thinking-exp-1219
を使用できます。
Google AI Studio
[設定] ペインの [モデル] プルダウン メニューで、Gemini 2.0 Flash Thinking Experimental モデルを選択します。
考え
モデルの考えが返される方法は、Gemini API を直接使用しているか、Google AI Studio を介してリクエストを送信しているかによって異なります。
Gemini API
モデルの思考プロセスは、モデルがレスポンスを生成するときに作成される content.parts
リストの最初の要素として返されます。たとえば、次のコードはモデルの思考プロセスのみを出力します。
response = client.models.generate_content(
model='gemini-2.0-flash-thinking-exp', contents='Solve 3*x^3-5*x=1'
)
Markdown(response.candidates[0].content.parts[0].text)
Gemini API を使用して思考モードを使用する方法の詳細な例については、Colab ノートブックをご覧ください。
Google AI Studio
モデルの思考プロセスは、レスポンス ウィンドウの [考え] パネルに新しいセクションとして返されます。
デフォルトでは、[考え] パネルは閉じられています。[考え] ヘッダーをクリックすると、パネルを展開できます。
返されたレスポンスと異なり、[考え] パネルの内容は Google AI Studio で編集できません。
制限事項
思考モードは試験運用版のモデルであり、次の制限があります。
- 32,000 個のトークン入力の上限
- テキストと画像の入力のみ
- 8,000 トークンの出力上限
- テキストのみの出力
- 検索やコード実行などの組み込みツールの使用なし
次のステップ
Colab ノートブックで思考モードを試すことができます。または、Google AI Studio を開いて、モデルにプロンプトを出すこともできます。