Gemini 2.0 Flash 设计思路

Gemini 2.0 Flash Thinking 模型是一种实验性模型,经过训练后,该模型会在回答问题时生成其所经历的“思考过程”。因此,与 Gemini 2.0 Flash 实验性模型相比,Flash Thinking 模型在回答问题时能够发挥更强的推理能力。

使用思维模型

您可以在 Google AI Studio 中使用闪电思考模型,也可以通过 Gemini API 使用。

Gemini API 不会在响应中返回想法。

如需使用思考模型,您需要将客户端设置为使用 v1alpha 版 API:

pip install -U google-genai
from google import genai
from google.genai import types

client = genai.Client(
    api_key=GOOGLE_API_KEY,

    http_options={'api_version':'v1alpha'},
)

发送基本请求

Python

此示例使用的是新的 Google Genai SDK

from google import genai

client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})

response = client.models.generate_content(
    model='gemini-2.0-flash-thinking-exp',
    contents='Explain how RLHF works in simple terms.',
)

print(response.text)

多轮思考对话

在多轮对话期间,您将整个对话记录作为输入传递,因此模型无法访问多轮对话中的先前想法。

Python

新的 Google Genai SDK 提供了创建多轮聊天会话的功能,这有助于管理对话状态。

from google import genai

client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})

chat = client.aio.chats.create(
    model='gemini-2.0-flash-thinking-exp',
)
response = await chat.send_message('What is your name?')
print(response.text)
response = await chat.send_message('What did you just say before this?')
print(response.text)

限制

Flash Thinking 模型是一款实验性模型,具有以下限制:

  • 仅限文本和图片输入
  • 仅输出文本
  • 无 JSON 模式或搜索着陆页
  • 思考内容仅在 Google AI Studio 中显示

后续操作