Tư duy nhanh Gemini 2.0

Mô hình Gemini 2.0 Flash Thinking là một mô hình thử nghiệm được huấn luyện để tạo ra "quá trình suy nghĩ" mà mô hình này trải qua trong phản hồi. Do đó, mô hình Flash Thinking có khả năng lập luận mạnh mẽ hơn trong câu trả lời so với mô hình Gemini 2.0 Flash Experimental.

Sử dụng mô hình tư duy

Các mô hình Tư duy nhanh có trong Google AI Studio và thông qua Gemini API. Gemini API không trả về suy nghĩ trong phản hồi.

Gửi yêu cầu cơ bản

Python

Ví dụ này sử dụng SDK Google Genai mới và phiên bản v1alpha của API.

from google import genai

client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})

response = client.models.generate_content(
    model='gemini-2.0-flash-thinking-exp',
    contents='Explain how RLHF works in simple terms.',
)

print(response.text)

Cuộc trò chuyện suy nghĩ nhiều lượt

Trong các cuộc trò chuyện có nhiều lượt, suy nghĩ từ các lượt trước đó sẽ bị xoá khỏi dữ liệu đầu vào của mô hình.

Python

SDK Google Genai mới có khả năng tạo phiên trò chuyện nhiều lượt, giúp quản lý trạng thái của cuộc trò chuyện.

from google import genai

client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})

chat = client.aio.chats.create(
    model='gemini-2.0-flash-thinking-exp',
)
response = await chat.send_message('What is your name?')
print(response.text)
response = await chat.send_message('What did you just say before this?')
print(response.text)

Các điểm hạn chế

Mô hình Tư duy nhanh là một mô hình thử nghiệm và có các hạn chế sau:

  • Không có chế độ JSON hoặc tính năng Tìm kiếm cơ sở
  • Ý tưởng chỉ xuất hiện trong Google AI Studio

Tiếp theo là gì?