Le mode de réflexion Gemini 2.0 Flash est un modèle expérimental qui est entraîné pour générer le "processus de réflexion" que le modèle suit dans le cadre de sa réponse. Par conséquent, le mode Pensée est capable de fournir des réponses plus pertinentes que le modèle Gemini 2.0 Flash de base.
Utiliser le mode Réflexion
Le mode Pensée est disponible en tant que modèle expérimental dans Google AI Studio et peut être utilisé directement dans l'API Gemini:
API Gemini
Spécifiez le code du modèle lorsque vous appelez l'API Gemini. Exemple :
response = client.models.generate_content(
model='gemini-2.0-flash-thinking-exp', contents='Explain the Pythagorean theorem to a 10-year-old.'
)
Vous pouvez utiliser gemini-2.0-flash-thinking-exp
ou gemini-2.0-flash-thinking-exp-1219
comme code de modèle.
Google AI Studio
Sélectionnez le modèle Gemini 2.0 Flash Thinking Experimental dans le menu déroulant Modèle du volet Paramètres.
Réflexions
La manière dont les pensées du modèle sont renvoyées dépend de si vous utilisez directement l'API Gemini ou si vous envoyez une requête via Google AI Studio.
API Gemini
Le processus de réflexion du modèle est renvoyé en tant que premier élément de la liste content.parts
créée lorsque le modèle génère la réponse. Par exemple, le code suivant n'imprime que le processus de réflexion du modèle:
response = client.models.generate_content(
model='gemini-2.0-flash-thinking-exp', contents='Solve 3*x^3-5*x=1'
)
Markdown(response.candidates[0].content.parts[0].text)
Pour voir d'autres exemples d'utilisation du mode Pensée avec l'API Gemini, consultez notre notebook Colab.
Google AI Studio
Le processus de réflexion du modèle est renvoyé sous la forme d'une nouvelle section dans le panneau Pensées de la fenêtre de réponse.
Par défaut, le panneau Pensées est réduit. Vous pouvez développer le panneau en cliquant sur l'en-tête Pensées.
Contrairement à la réponse renvoyée, le contenu du panneau Pensées n'est pas modifiable dans Google AI Studio.
Limites
Le mode Pensée est un modèle expérimental qui présente les limites suivantes:
- Limite d'entrée de 32 000 jetons
- Saisie de texte et d'images uniquement
- Limite de sortie de 8 000 jetons
- Sortie en texte uniquement
- Aucune utilisation d'outil intégré tel que la recherche ou l'exécution de code
Étape suivante
Essayez le mode Pensée par vous-même avec notre notebook Colab, ou ouvrez Google AI Studio et essayez d'inviter le modèle vous-même.