O modelo Gemini 2.0 Flash Thinking é um modelo experimental treinado para gerar o "processo de pensamento" que ele passa como parte da resposta. Como resultado, o modelo Flash Thinking tem capacidades de raciocínio mais fortes nas respostas do que o modelo experimental Flash 2.0.
Usar modelos de pensamento
Os modelos de pensamento rápido estão disponíveis no Google AI Studio e na API Gemini. A API Gemini não retorna pensamentos na resposta.
Enviar uma solicitação básica
Este exemplo usa o novo
SDK do Google Genai e a versão v1alpha
da API.
from google import genai
client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})
response = client.models.generate_content(
model='gemini-2.0-flash-thinking-exp',
contents='Explain how RLHF works in simple terms.',
)
print(response.text)
Conversas de pensamento com vários turnos
Durante conversas de várias interações, os pensamentos das interações anteriores são removidos das entradas do modelo.
O novo SDK do Google GenAI permite criar uma sessão de chat com várias interações, o que é útil para gerenciar o estado de uma conversa.
from google import genai
client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})
chat = client.aio.chats.create(
model='gemini-2.0-flash-thinking-exp',
)
response = await chat.send_message('What is your name?')
print(response.text)
response = await chat.send_message('What did you just say before this?')
print(response.text)
Limitações
O modelo Flash Thinking é experimental e tem as seguintes limitações:
- Nenhum modo JSON ou base de pesquisa
- As ideias só aparecem no Google AI Studio
A seguir
- Teste o modelo de pensamento rápido no Google AI Studio.
- Teste o Colab do Flash Thinking.