Gemini 2.0 Flash Thinking

Gemini 2.0 Flash Thinking モデルは、レスポンスの一部としてモデルが行う「思考プロセス」を生成するようにトレーニングされた試験運用版モデルです。その結果、Flash Thinking モデルは、Gemini 2.0 Flash 試験運用版モデルよりも回答の推論能力が強化されています。

思考モデルを使用する

Flash Thinking モデルは、Google AI Studio と Gemini API で使用できます。Gemini API はレスポンスで考えを返しません。

基本的なリクエストを送信する

Python

この例では、新しい Google Genai SDKv1alpha バージョンの API を使用します。

from google import genai

client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})

response = client.models.generate_content(
    model='gemini-2.0-flash-thinking-exp',
    contents='Explain how RLHF works in simple terms.',
)

print(response.text)

マルチターンの思考型会話

マルチターンの会話では、前のターンの思考はモデルの入力から削除されます。

Python

新しい Google Genai SDK には、会話の状態を管理するのに役立つマルチターン チャット セッションを作成する機能が用意されています。

from google import genai

client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})

chat = client.aio.chats.create(
    model='gemini-2.0-flash-thinking-exp',
)
response = await chat.send_message('What is your name?')
print(response.text)
response = await chat.send_message('What did you just say before this?')
print(response.text)

制限事項

Flash Thinking モデルは試験運用版のモデルであり、次の制限があります。

  • JSON モードまたは検索グラウンドングなし
  • 考えは Google AI Studio にのみ表示されます

次のステップ