Gemini 2.0 Flash Thinking

El modelo de Gemini 2.0 Flash Thinking es un modelo experimental que se entrena para generar el "proceso de pensamiento" que atraviesa el modelo como parte de su respuesta. Como resultado, el modelo de Flash Thinking es capaz de tener capacidades de razonamiento más sólidas en sus respuestas que el modelo experimental de Gemini 2.0 Flash.

Usa modelos de pensamiento

Los modelos de pensamiento rápido están disponibles en Google AI Studio y a través de la API de Gemini. La API de Gemini no muestra pensamientos en la respuesta.

Cómo enviar una solicitud básica

Python

En este ejemplo, se usa el nuevo SDK de Google Genai y la versión v1alpha de la API.

from google import genai

client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})

response = client.models.generate_content(
    model='gemini-2.0-flash-thinking-exp',
    contents='Explain how RLHF works in simple terms.',
)

print(response.text)

Conversaciones de pensamiento de varios turnos

Durante las conversaciones de varios turnos, los pensamientos de los turnos anteriores se quitan de las entradas del modelo.

Python

El nuevo SDK de Google Genai proporciona la capacidad de crear una sesión de chat de varias vueltas, lo que es útil para administrar el estado de una conversación.

from google import genai

client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})

chat = client.aio.chats.create(
    model='gemini-2.0-flash-thinking-exp',
)
response = await chat.send_message('What is your name?')
print(response.text)
response = await chat.send_message('What did you just say before this?')
print(response.text)

Limitaciones

El modelo de Flash Thinking es experimental y tiene las siguientes limitaciones:

  • No hay modo JSON ni vinculación de búsqueda
  • Las ideas solo se muestran en Google AI Studio.

Próximos pasos