Modo de pensamento rápido do Gemini 2.0

O modo de pensamento rápido do Gemini 2.0 é um modelo experimental treinado para gerar o "processo de pensamento" que o modelo passa como parte da resposta. Como resultado, o Modo de pensamento tem recursos de raciocínio mais fortes nas respostas do que o modelo básico do Gemini 2.0 Flash.

Usar o Modo de pensamento

O Modo de pensamento está disponível como um modelo experimental no Google AI Studio e para uso direto na API Gemini:

API Gemini

Especifique o código do modelo ao fazer uma chamada para a API Gemini. Exemplo:

response = client.models.generate_content(
    model='gemini-2.0-flash-thinking-exp', contents='Explain the Pythagorean theorem to a 10-year-old.'
)

É possível usar gemini-2.0-flash-thinking-exp ou gemini-2.0-flash-thinking-exp-1219 como o código do modelo.

Google AI Studio

Selecione o modelo Gemini 2.0 Flash Thinking Experimental no menu suspenso Modelo no painel Configurações.

Pensamentos

A forma como os pensamentos do modelo são retornados depende se você está usando a API Gemini diretamente ou fazendo uma solicitação pelo Google AI Studio.

API Gemini

O processo de pensamento do modelo é retornado como o primeiro elemento da lista content.parts criada quando o modelo gera a resposta. Por exemplo, o código a seguir imprime apenas o processo de pensamento do modelo:

response = client.models.generate_content(
    model='gemini-2.0-flash-thinking-exp', contents='Solve 3*x^3-5*x=1'
)

Markdown(response.candidates[0].content.parts[0].text)

Confira mais exemplos de como usar o Modo de pensamento com a API Gemini no nosso notebook do Colab.

Google AI Studio

O processo de pensamento do modelo é retornado como uma nova seção no painel Thoughts na janela de resposta.

Exemplo de painel de pensamentos no Google AI Studio

Por padrão, o painel Thoughts está recolhido. É possível expandir o painel clicando no cabeçalho Thoughts.

Ao contrário da resposta retornada, o conteúdo do painel Thoughts não pode ser editado no Google AI Studio.

Limitações

O Modo de pensamento é um modelo experimental e tem as seguintes limitações:

  • Limite de 32 mil de entrada de tokens
  • Somente entrada de texto e imagem
  • Limite de saída de 8 mil tokens
  • Saída somente de texto
  • Não use ferramentas integradas, como a Pesquisa ou a execução de código.

A seguir

Teste o Modo de pensamento com nosso notebook Colab, ou abra o Google AI Studio e tente solicitar o modelo.