Gemini 2.0 Flash Thinking

Gemini 2.0 Flash Thinking 模型是一種實驗模型,經過訓練後,可產生模型在回應過程中經歷的「思考過程」。因此,Flash Thinking 模型的回覆比 Gemini 2.0 Flash 實驗模型更能發揮推理能力。

使用思考模型

您可以在 Google AI Studio 和 Gemini API 中使用 Flash Thinking 模型。

Gemini API 不會在回應中傳回想法。

如要使用思考模型,您必須將用戶端設為使用 API 的 v1alpha 版本:

pip install -U google-genai
from google import genai
from google.genai import types

client = genai.Client(
    api_key=GOOGLE_API_KEY,

    http_options={'api_version':'v1alpha'},
)

傳送基本要求

Python

這個範例使用新的 Google Genai SDK

from google import genai

client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})

response = client.models.generate_content(
    model='gemini-2.0-flash-thinking-exp',
    contents='Explain how RLHF works in simple terms.',
)

print(response.text)

多輪思考對話

在多輪對話期間,您會將整個對話記錄傳遞為輸入內容,因此模型無法在多輪對話中存取先前的想法。

Python

新的 Google Genai SDK 可建立多回合聊天會話,有助於管理對話狀態。

from google import genai

client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})

chat = client.aio.chats.create(
    model='gemini-2.0-flash-thinking-exp',
)
response = await chat.send_message('What is your name?')
print(response.text)
response = await chat.send_message('What did you just say before this?')
print(response.text)

限制

Flash Thinking 模型為實驗性模型,因此有下列限制:

  • 僅輸入文字和圖片
  • 僅輸出文字
  • 沒有 JSON 模式或搜尋基礎
  • 系統只會在 Google AI Studio 中顯示「想法」

後續步驟