Gemini 2.0 Flash Thinking

O modelo Gemini 2.0 Flash Thinking é um modelo experimental treinado para gerar o "processo de pensamento" que ele passa como parte da resposta. Como resultado, o modelo Flash Thinking tem capacidades de raciocínio mais fortes nas respostas do que o modelo experimental Flash 2.0.

Usar modelos de pensamento

Os modelos de pensamento rápido estão disponíveis no Google AI Studio e na API Gemini. A API Gemini não retorna pensamentos na resposta.

Enviar uma solicitação básica

Python

Este exemplo usa o novo SDK do Google Genai e a versão v1alpha da API.

from google import genai

client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})

response = client.models.generate_content(
    model='gemini-2.0-flash-thinking-exp',
    contents='Explain how RLHF works in simple terms.',
)

print(response.text)

Conversas de pensamento com vários turnos

Durante conversas de várias interações, os pensamentos das interações anteriores são removidos das entradas do modelo.

Python

O novo SDK do Google GenAI permite criar uma sessão de chat com várias interações, o que é útil para gerenciar o estado de uma conversa.

from google import genai

client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})

chat = client.aio.chats.create(
    model='gemini-2.0-flash-thinking-exp',
)
response = await chat.send_message('What is your name?')
print(response.text)
response = await chat.send_message('What did you just say before this?')
print(response.text)

Limitações

O modelo Flash Thinking é experimental e tem as seguintes limitações:

  • Nenhum modo JSON ou base de pesquisa
  • As ideias só aparecem no Google AI Studio

A seguir