El modelo de Gemini 2.0 Flash Thinking es un modelo experimental que se entrena para generar el "proceso de pensamiento" que atraviesa el modelo como parte de su respuesta. Como resultado, el modelo de Flash Thinking es capaz de tener capacidades de razonamiento más sólidas en sus respuestas que el modelo experimental de Gemini 2.0 Flash.
Usa modelos de pensamiento
Los modelos de pensamiento rápido están disponibles en Google AI Studio y a través de la API de Gemini. La API de Gemini no muestra pensamientos en la respuesta.
Cómo enviar una solicitud básica
Python
En este ejemplo, se usa el nuevo
SDK de Google Genai y la versión v1alpha
de la API.
from google import genai
client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})
response = client.models.generate_content(
model='gemini-2.0-flash-thinking-exp',
contents='Explain how RLHF works in simple terms.',
)
print(response.text)
Conversaciones de pensamiento de varios turnos
Durante las conversaciones de varios turnos, los pensamientos de los turnos anteriores se quitan de las entradas del modelo.
Python
El nuevo SDK de Google Genai proporciona la capacidad de crear una sesión de chat de varias vueltas, lo que es útil para administrar el estado de una conversación.
from google import genai
client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})
chat = client.aio.chats.create(
model='gemini-2.0-flash-thinking-exp',
)
response = await chat.send_message('What is your name?')
print(response.text)
response = await chat.send_message('What did you just say before this?')
print(response.text)
Limitaciones
El modelo de Flash Thinking es experimental y tiene las siguientes limitaciones:
- No hay modo JSON ni vinculación de búsqueda
- Las ideas solo se muestran en Google AI Studio.
Próximos pasos
- Prueba el modelo de pensamiento rápido en Google AI Studio.
- Prueba el Colab de Flash Thinking.