Gemini 2.0 Flash Thinking

El modelo de pensamiento Gemini 2.0 Flash es un modelo experimental que se entrena para generar el "proceso de pensamiento" que atraviesa el modelo como parte de su respuesta. Como resultado, el modelo de pensamiento rápido es capaz de tener capacidades de razonamiento más sólidas en sus respuestas que el modelo experimental de Gemini 2.0 Flash.

Usa modelos de pensamiento

Los modelos de pensamiento rápido están disponibles en Google AI Studio y a través de la API de Gemini.

La API de Gemini no muestra pensamientos en la respuesta.

Para usar el modelo de pensamiento, debes configurar tu cliente para que use la versión v1alpha de la API:

pip install -U google-genai
from google import genai
from google.genai import types

client = genai.Client(
    api_key=GOOGLE_API_KEY,

    http_options={'api_version':'v1alpha'},
)

Cómo enviar una solicitud básica

Python

En este ejemplo, se usa el nuevo SDK de Google Genai.

from google import genai

client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})

response = client.models.generate_content(
    model='gemini-2.0-flash-thinking-exp',
    contents='Explain how RLHF works in simple terms.',
)

print(response.text)

Conversaciones de pensamiento de varios turnos

Durante las conversaciones de varios turnos, pasas todo el historial de conversaciones como entrada, por lo que el modelo no tiene acceso a sus pensamientos anteriores en una conversación de varios turnos.

Python

El nuevo SDK de Google Genai proporciona la capacidad de crear una sesión de chat de varias vueltas, lo que es útil para administrar el estado de una conversación.

from google import genai

client = genai.Client(api_key='GEMINI_API_KEY', http_options={'api_version':'v1alpha'})

chat = client.aio.chats.create(
    model='gemini-2.0-flash-thinking-exp',
)
response = await chat.send_message('What is your name?')
print(response.text)
response = await chat.send_message('What did you just say before this?')
print(response.text)

Limitaciones

El modelo de pensamiento rápido es un modelo experimental y tiene las siguientes limitaciones:

  • Solo entrada de imagen y texto
  • Salida de solo texto
  • No hay modo JSON ni vinculación de búsqueda
  • Las ideas solo se muestran en Google AI Studio.

Próximos pasos