Das Gemini 2.0 Flash Thinking-Modell ist ein experimentelles Modell, das darauf trainiert ist, den „Denkprozess“ zu generieren, den das Modell als Teil seiner Antwort durchläuft. Das Flash Thinking-Modell kann in seinen Antworten daher bessere Schlussfolgerungen ziehen als das experimentelle Gemini 2.0 Flash-Modell.
Denkmodelle verwenden
Flash-Thinking-Modelle sind in Google AI Studio und über die Gemini API verfügbar. Die Gemini API gibt in der Antwort keine Gedanken zurück.
Einfache Anfrage senden
In diesem Beispiel wird das neue Google Genai SDK und die v1alpha
-Version der API verwendet.
from google import genai
client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})
response = client.models.generate_content(
model='gemini-2.0-flash-thinking-exp',
contents='Explain how RLHF works in simple terms.',
)
print(response.text)
Mehrere Unterhaltungen mit Nachfragen
Bei Unterhaltungen mit mehreren Gesprächsrunden werden die Gedanken aus vorherigen Gesprächsrunden aus den Eingaben des Modells entfernt.
Mit dem neuen Google Genai SDK können Sie eine Chatsitzung mit mehreren Antworten erstellen, was hilfreich ist, um den Status einer Unterhaltung zu verwalten.
from google import genai
client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})
chat = client.aio.chats.create(
model='gemini-2.0-flash-thinking-exp',
)
response = await chat.send_message('What is your name?')
print(response.text)
response = await chat.send_message('What did you just say before this?')
print(response.text)
Beschränkungen
Das Flash-Thinking-Modell ist ein experimentelles Modell und unterliegt den folgenden Einschränkungen:
- Kein JSON-Modus oder keine Suchgrundlage
- Gedanken werden nur in Google AI Studio angezeigt.
Nächste Schritte
- Probieren Sie das Modell „Schnelles Denken“ in Google AI Studio aus.
- Probieren Sie das Flash-Thinking-Colab aus.