Gemini 2.0 Flash Thinking 模型是一種實驗模型,經過訓練後,可產生模型在回應過程中經歷的「思考過程」。因此,Flash Thinking 模型的回覆比 Gemini 2.0 Flash 實驗模型更能發揮推理能力。
使用思考模型
您可以在 Google AI Studio 和 Gemini API 中使用 Flash Thinking 模型。
Gemini API 不會在回應中傳回想法。
如要使用思考模型,您必須將用戶端設為使用 API 的 v1alpha
版本:
pip install -U google-genai
from google import genai
from google.genai import types
client = genai.Client(
api_key=GOOGLE_API_KEY,
http_options={'api_version':'v1alpha'},
)
傳送基本要求
Python
這個範例使用新的 Google Genai SDK。
from google import genai
client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})
response = client.models.generate_content(
model='gemini-2.0-flash-thinking-exp',
contents='Explain how RLHF works in simple terms.',
)
print(response.text)
多輪思考對話
在多輪對話期間,您會將整個對話記錄傳遞為輸入內容,因此模型無法在多輪對話中存取先前的想法。
Python
新的 Google Genai SDK 可建立多回合聊天會話,有助於管理對話狀態。
from google import genai
client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})
chat = client.aio.chats.create(
model='gemini-2.0-flash-thinking-exp',
)
response = await chat.send_message('What is your name?')
print(response.text)
response = await chat.send_message('What did you just say before this?')
print(response.text)
限制
Flash Thinking 模型為實驗性模型,因此有下列限制:
- 僅輸入文字和圖片
- 僅輸出文字
- 沒有 JSON 模式或搜尋基礎
- 系統只會在 Google AI Studio 中顯示「想法」
後續步驟
- 在 Google AI Studio 中試用 Flash Thinking 模型。
- 試試 Flash Thinking Colab。