Gemini 2.0 Flash Thinking 模型是一种实验性模型,经过训练后,该模型会在回答问题时生成其所经历的“思考过程”。因此,与 Gemini 2.0 Flash 实验性模型相比,Flash Thinking 模型在回答问题时能够发挥更强的推理能力。
使用思维模型
您可以在 Google AI Studio 中使用闪电思考模型,也可以通过 Gemini API 使用。
Gemini API 不会在响应中返回想法。
如需使用思考模型,您需要将客户端设置为使用 v1alpha
版 API:
pip install -U google-genai
from google import genai
from google.genai import types
client = genai.Client(
api_key=GOOGLE_API_KEY,
http_options={'api_version':'v1alpha'},
)
发送基本请求
此示例使用的是新的 Google Genai SDK。
from google import genai
client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})
response = client.models.generate_content(
model='gemini-2.0-flash-thinking-exp',
contents='Explain how RLHF works in simple terms.',
)
print(response.text)
多轮思考对话
在多轮对话期间,您将整个对话记录作为输入传递,因此模型无法访问多轮对话中的先前想法。
新的 Google Genai SDK 提供了创建多轮聊天会话的功能,这有助于管理对话状态。
from google import genai
client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})
chat = client.aio.chats.create(
model='gemini-2.0-flash-thinking-exp',
)
response = await chat.send_message('What is your name?')
print(response.text)
response = await chat.send_message('What did you just say before this?')
print(response.text)
限制
Flash Thinking 模型是一款实验性模型,具有以下限制:
- 仅限文本和图片输入
- 仅输出文本
- 无 JSON 模式或搜索着陆页
- 思考内容仅在 Google AI Studio 中显示
后续操作
- 在 Google AI Studio 中试用“闪电思考”模型。
- 试用 Flash Thinking Colab。