Gemini 2.0 Flash Thinking モデルは、レスポンスの一部としてモデルが行う「思考プロセス」を生成するようにトレーニングされた試験運用版モデルです。その結果、Flash Thinking モデルは、Gemini 2.0 Flash 試験運用版モデルよりも回答の推論能力が強化されています。
思考モデルを使用する
Flash Thinking モデルは、Google AI Studio と Gemini API で利用できます。
Gemini API はレスポンスで考えを返しません。
思考モデルを使用するには、v1alpha
バージョンの API を使用するようにクライアントを設定する必要があります。
pip install -U google-genai
from google import genai
from google.genai import types
client = genai.Client(
api_key=GOOGLE_API_KEY,
http_options={'api_version':'v1alpha'},
)
基本的なリクエストを送信する
Python
この例では、新しい Google Genai SDK を使用しています。
from google import genai
client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})
response = client.models.generate_content(
model='gemini-2.0-flash-thinking-exp',
contents='Explain how RLHF works in simple terms.',
)
print(response.text)
マルチターンの思考型会話
マルチターンの会話では、会話履歴全体を入力として渡すため、マルチターンの会話でモデルは以前の思考にアクセスできません。
Python
新しい Google Genai SDK には、会話の状態を管理するのに役立つマルチターン チャット セッションを作成する機能が用意されています。
from google import genai
client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})
chat = client.aio.chats.create(
model='gemini-2.0-flash-thinking-exp',
)
response = await chat.send_message('What is your name?')
print(response.text)
response = await chat.send_message('What did you just say before this?')
print(response.text)
制限事項
Flash Thinking モデルは試験運用版のモデルであり、次の制限があります。
- テキストと画像の入力のみ
- テキストのみの出力
- JSON モードまたは検索グラウンドングなし
- 考えは Google AI Studio にのみ表示されます
次のステップ
- Google AI Studio で Flash Thinking モデルをお試しください。
- Flash Thinking Colab を試す。