Il modello Gemini 2.0 Flash Thinking è un modello sperimentale addestrato per generare il "processo di pensiero " che il modello segue nell'ambito della sua risposta. Di conseguenza, il modello Flash Thinking è in grado di offrire risposte con capacità di ragionamento superiori rispetto al modello Gemini 2.0 Flash Experimental.
Utilizza modelli di pensiero
I modelli di pensiero rapido sono disponibili in Google AI Studio e tramite l'API Gemini. L'API Gemini non restituisce pensieri nella risposta.
Inviare una richiesta di base
Python
Questo esempio utilizza il nuovo
SDK Google Genai e la versione v1alpha
dell'API.
from google import genai
client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})
response = client.models.generate_content(
model='gemini-2.0-flash-thinking-exp',
contents='Explain how RLHF works in simple terms.',
)
print(response.text)
Conversazioni di pensiero a più turni
Durante le conversazioni a più turni, i pensieri dei turni precedenti vengono rimossi dagli input del modello.
Python
Il nuovo SDK Google Genai consente di creare una sessione di chat con più turni, utile per gestire lo stato di una conversazione.
from google import genai
client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})
chat = client.aio.chats.create(
model='gemini-2.0-flash-thinking-exp',
)
response = await chat.send_message('What is your name?')
print(response.text)
response = await chat.send_message('What did you just say before this?')
print(response.text)
Limitazioni
Il modello Flash Thinking è un modello sperimentale e presenta le seguenti limitazioni:
- Nessuna modalità JSON o definizione del contesto di ricerca
- I pensieri vengono mostrati solo in Google AI Studio
Passaggi successivi
- Prova il modello di pensiero rapido in Google AI Studio.
- Prova Flash Thinking Colab.