Mô hình Gemini 2.0 Flash Thinking là một mô hình thử nghiệm được huấn luyện để tạo ra "quá trình suy nghĩ" mà mô hình này trải qua trong phản hồi. Do đó, mô hình Flash Thinking có khả năng lập luận mạnh mẽ hơn trong câu trả lời so với mô hình Gemini 2.0 Flash Experimental.
Sử dụng mô hình tư duy
Các mô hình Tư duy nhanh có trong Google AI Studio và thông qua Gemini API. Gemini API không trả về suy nghĩ trong phản hồi.
Gửi yêu cầu cơ bản
Ví dụ này sử dụng SDK Google Genai mới và phiên bản v1alpha
của API.
from google import genai
client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})
response = client.models.generate_content(
model='gemini-2.0-flash-thinking-exp',
contents='Explain how RLHF works in simple terms.',
)
print(response.text)
Cuộc trò chuyện suy nghĩ nhiều lượt
Trong các cuộc trò chuyện có nhiều lượt, suy nghĩ từ các lượt trước đó sẽ bị xoá khỏi dữ liệu đầu vào của mô hình.
SDK Google Genai mới có khả năng tạo phiên trò chuyện nhiều lượt, giúp quản lý trạng thái của cuộc trò chuyện.
from google import genai
client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})
chat = client.aio.chats.create(
model='gemini-2.0-flash-thinking-exp',
)
response = await chat.send_message('What is your name?')
print(response.text)
response = await chat.send_message('What did you just say before this?')
print(response.text)
Các điểm hạn chế
Mô hình Tư duy nhanh là một mô hình thử nghiệm và có các hạn chế sau:
- Không có chế độ JSON hoặc tính năng Tìm kiếm cơ sở
- Ý tưởng chỉ xuất hiện trong Google AI Studio
Tiếp theo là gì?
- Thử mô hình Tư duy nhanh trong Google AI Studio.
- Hãy thử Colab Flash Thinking.