Gemini 2.0 Flash Thinking

Il modello Gemini 2.0 Flash Thinking è un modello sperimentale addestrato per generare il "processo di pensiero " che il modello segue nell'ambito della sua risposta. Di conseguenza, il modello Flash Thinking è in grado di offrire risposte con capacità di ragionamento superiori rispetto al modello Gemini 2.0 Flash Experimental.

Utilizza modelli di pensiero

I modelli di pensiero rapido sono disponibili in Google AI Studio e tramite l'API Gemini. L'API Gemini non restituisce pensieri nella risposta.

Inviare una richiesta di base

Python

Questo esempio utilizza il nuovo SDK Google Genai e la versione v1alpha dell'API.

from google import genai

client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})

response = client.models.generate_content(
    model='gemini-2.0-flash-thinking-exp',
    contents='Explain how RLHF works in simple terms.',
)

print(response.text)

Conversazioni di pensiero a più turni

Durante le conversazioni a più turni, i pensieri dei turni precedenti vengono rimossi dagli input del modello.

Python

Il nuovo SDK Google Genai consente di creare una sessione di chat con più turni, utile per gestire lo stato di una conversazione.

from google import genai

client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})

chat = client.aio.chats.create(
    model='gemini-2.0-flash-thinking-exp',
)
response = await chat.send_message('What is your name?')
print(response.text)
response = await chat.send_message('What did you just say before this?')
print(response.text)

Limitazioni

Il modello Flash Thinking è un modello sperimentale e presenta le seguenti limitazioni:

  • Nessuna modalità JSON o definizione del contesto di ricerca
  • I pensieri vengono mostrati solo in Google AI Studio

Passaggi successivi