O modo de pensamento rápido do Gemini 2.0 é um modelo experimental treinado para gerar o "processo de pensamento" que o modelo passa como parte da resposta. Como resultado, o Modo de pensamento tem recursos de raciocínio mais fortes nas respostas do que o modelo básico do Gemini 2.0 Flash.
Usar o Modo de pensamento
O Modo de pensamento está disponível como um modelo experimental no Google AI Studio e para uso direto na API Gemini:
API Gemini
Especifique o código do modelo ao fazer uma chamada para a API Gemini. Exemplo:
response = client.models.generate_content(
model='gemini-2.0-flash-thinking-exp', contents='Explain the Pythagorean theorem to a 10-year-old.'
)
É possível usar gemini-2.0-flash-thinking-exp
ou
gemini-2.0-flash-thinking-exp-1219
como o código do modelo.
Google AI Studio
Selecione o modelo Gemini 2.0 Flash Thinking Experimental no menu suspenso Modelo no painel Configurações.
Pensamentos
A forma como os pensamentos do modelo são retornados depende se você está usando a API Gemini diretamente ou fazendo uma solicitação pelo Google AI Studio.
API Gemini
O processo de pensamento do modelo é retornado como o primeiro elemento da
lista content.parts
criada quando o modelo gera a resposta. Por
exemplo, o código a seguir imprime apenas o processo de pensamento do modelo:
response = client.models.generate_content(
model='gemini-2.0-flash-thinking-exp', contents='Solve 3*x^3-5*x=1'
)
Markdown(response.candidates[0].content.parts[0].text)
Confira mais exemplos de como usar o Modo de pensamento com a API Gemini no nosso notebook do Colab.
Google AI Studio
O processo de pensamento do modelo é retornado como uma nova seção no painel Thoughts na janela de resposta.
Por padrão, o painel Thoughts está recolhido. É possível expandir o painel clicando no cabeçalho Thoughts.
Ao contrário da resposta retornada, o conteúdo do painel Thoughts não pode ser editado no Google AI Studio.
Limitações
O Modo de pensamento é um modelo experimental e tem as seguintes limitações:
- Limite de 32 mil de entrada de tokens
- Somente entrada de texto e imagem
- Limite de saída de 8 mil tokens
- Saída somente de texto
- Não use ferramentas integradas, como a Pesquisa ou a execução de código.
A seguir
Teste o Modo de pensamento com nosso notebook Colab, ou abra o Google AI Studio e tente solicitar o modelo.