Gemini 2.0 Flash Thinking

Gemini 2.0 Flash Thinking モデルは、レスポンスの一部としてモデルが行う「思考プロセス」を生成するようにトレーニングされた試験運用版モデルです。その結果、Flash Thinking モデルは、Gemini 2.0 Flash 試験運用版モデルよりも回答の推論能力が強化されています。

思考モデルを使用する

Flash Thinking モデルは、Google AI Studio と Gemini API で利用できます。

Gemini API はレスポンスで考えを返しません。

思考モデルを使用するには、v1alpha バージョンの API を使用するようにクライアントを設定する必要があります。

pip install -U google-genai
from google import genai
from google.genai import types

client = genai.Client(
    api_key=GOOGLE_API_KEY,

    http_options={'api_version':'v1alpha'},
)

基本的なリクエストを送信する

Python

この例では、新しい Google Genai SDK を使用しています。

from google import genai

client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})

response = client.models.generate_content(
    model='gemini-2.0-flash-thinking-exp',
    contents='Explain how RLHF works in simple terms.',
)

print(response.text)

マルチターンの思考型会話

マルチターンの会話では、会話履歴全体を入力として渡すため、マルチターンの会話でモデルは以前の思考にアクセスできません。

Python

新しい Google Genai SDK には、会話の状態を管理するのに役立つマルチターン チャット セッションを作成する機能が用意されています。

from google import genai

client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})

chat = client.aio.chats.create(
    model='gemini-2.0-flash-thinking-exp',
)
response = await chat.send_message('What is your name?')
print(response.text)
response = await chat.send_message('What did you just say before this?')
print(response.text)

制限事項

Flash Thinking モデルは試験運用版のモデルであり、次の制限があります。

  • テキストと画像の入力のみ
  • テキストのみの出力
  • JSON モードまたは検索グラウンドングなし
  • 考えは Google AI Studio にのみ表示されます

次のステップ