Gemini 2.0 Flash Thinking

O modelo de pensamento rápido Gemini 2.0 é um modelo experimental treinado para gerar o "processo de pensamento" que o modelo passa como parte da resposta. Como resultado, o modelo Flash Thinking tem capacidades de raciocínio mais fortes nas respostas do que o modelo Gemini 2.0 Flash Experimental.

Usar modelos de pensamento

Os modelos de pensamento rápido estão disponíveis no Google AI Studio e na API Gemini.

A API Gemini não retorna pensamentos na resposta.

Para usar o modelo de pensamento, você precisa definir o cliente para usar a versão v1alpha da API:

pip install -U google-genai
from google import genai
from google.genai import types

client = genai.Client(
    api_key=GOOGLE_API_KEY,

    http_options={'api_version':'v1alpha'},
)

Enviar uma solicitação básica

Python

Este exemplo usa o novo SDK do Google Genai.

from google import genai

client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})

response = client.models.generate_content(
    model='gemini-2.0-flash-thinking-exp',
    contents='Explain how RLHF works in simple terms.',
)

print(response.text)

Conversas de pensamento com vários turnos

Durante conversas com várias interações, você transmite todo o histórico de conversas como entrada. Portanto, o modelo não tem acesso aos pensamentos anteriores em uma conversa com várias interações.

Python

O novo SDK do Google GenAI permite criar uma sessão de chat com várias interações, o que é útil para gerenciar o estado de uma conversa.

from google import genai

client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})

chat = client.aio.chats.create(
    model='gemini-2.0-flash-thinking-exp',
)
response = await chat.send_message('What is your name?')
print(response.text)
response = await chat.send_message('What did you just say before this?')
print(response.text)

Limitações

O modelo de pensamento rápido é experimental e tem as seguintes limitações:

  • Somente entrada de texto e imagem
  • Saída somente de texto
  • Nenhum modo JSON ou base de pesquisa
  • Os pensamentos só aparecem no Google AI Studio

A seguir