API de Interactions
La API de Interactions es el nuevo estándar primitivo para compilar con Gemini, y se recomienda para todos los proyectos nuevos. Está optimizada para flujos de trabajo basados en agentes, administración de estados del servidor y conversaciones multimodales y de varios turnos complejas. La API original de generateContent sigue siendo totalmente compatible.
¿Por qué usar la API de Interactions?
- Administración del historial del servidor: Se simplificaron los flujos de varias interacciones a través de
previous_interaction_id. El servidor habilita el estado de forma predeterminada (store=true), pero puedes habilitar el comportamiento sin estado configurandostore=false. - Pasos de ejecución observables: Los pasos escritos facilitan la depuración de flujos complejos y la renderización de la IU para eventos intermedios (como pensamientos o widgets de búsqueda).
- Creado para flujos de trabajo de agentes: Compatibilidad nativa con el uso de herramientas de varios pasos, la organización y los flujos de razonamiento complejos a través de pasos de ejecución escritos.
- Tareas en segundo plano y de larga duración: Admite la descarga de operaciones que requieren mucho tiempo, como Deep Think y Deep Research, a procesos en segundo plano con
background=true. - Acceso a nuevos modelos y capacidades: En el futuro, se lanzarán nuevos modelos más allá de la familia principal, junto con nuevas capacidades de agente y herramientas, exclusivamente en la API de Interactions.
Usa la API de Interactions si estás comenzando un proyecto nuevo, creando aplicaciones basadas en agentes o necesitas administración de conversaciones del servidor. Usa generateContent si tienes una integración existente que satisface tus necesidades o si necesitas una función que aún no está disponible en la API de Interactions, como la API de Batch o el almacenamiento en caché explícito.
Comenzar
- Configura tu agente de programación: Conéctate al MCP de Gemini Docs y, luego, instala la habilidad
gemini-interactions-apipara que tu asistente tenga acceso directo a la documentación para desarrolladores y las prácticas recomendadas más recientes. Configura tu agente de programación → - Migra desde
generateContent: Si tienes una integración existente, sigue la Guía de migración para realizar la transición a la API de Interactions. - Prueba la guía de inicio rápido: Comienza con un ejemplo de trabajo mínimo en la guía de inicio rápido de la API de Interactions.
Guías de funciones
Explora las capacidades específicas de la API de Interactions a través de estas guías. Puedes usar el botón de activación de estas páginas para alternar entre la API de Interactions y la de generateContent:
- Generación de texto
- Generación de imágenes
- Comprensión de imágenes
- Comprensión de audio
- Comprensión de videos
- Procesamiento de documentos
- Llamada a función
- Salidas estructuradas
- Agente de Deep Research
- Inferencia flexible
- Inferencia de prioridad
Cómo funciona la API de Interactions
La API de Interactions se centra en un recurso principal: Interaction. Un Interaction representa un turno completo en una conversación o tarea. Actúa como un registro de sesión, que contiene todo el historial de una interacción como una secuencia cronológica de pasos de ejecución. Estos pasos incluyen las reflexiones del modelo, las llamadas a herramientas y los resultados del servidor o del cliente (como function_call y function_result), y el model_output final. El recurso almacenado (recuperado a través de interactions.get) también incluye pasos de user_input para el contexto completo, aunque la respuesta de interactions.create solo devuelve los pasos generados por el modelo.
Cuando llamas a interactions.create, creas un nuevo recurso Interaction.
Administración del estado del servidor
Puedes usar el id de una interacción completada en una llamada posterior con el parámetro previous_interaction_id para continuar la conversación. El servidor usa este ID para recuperar el historial de conversación, lo que te evita tener que volver a enviar todo el historial de chat.
El parámetro previous_interaction_id solo conserva el historial de conversaciones (entradas y salidas) con previous_interaction_id. Los demás parámetros son de alcance de la interacción y se aplican solo a la interacción específica que estás generando:
toolssystem_instructiongeneration_config(incluidosthinking_level,temperature, etcétera)
Esto significa que debes volver a especificar estos parámetros en cada interacción nueva si quieres que se apliquen. Esta administración de estado del servidor es opcional. También puedes operar en modo sin estado enviando el historial de conversación completo en cada solicitud.
Almacenamiento y retención de datos
De forma predeterminada, la API almacena todos los objetos Interaction (store=true) para simplificar el uso de las funciones de administración de estados del servidor (con previous_interaction_id), la ejecución en segundo plano (con background=true) y los fines de observabilidad.
- Nivel pagado: El sistema conserva las interacciones durante 55 días.
- Nivel gratuito: El sistema retiene las interacciones durante 1 día.
Si no quieres esto, puedes establecer store=false en tu solicitud. Este control es independiente de la administración del estado. Puedes inhabilitar el almacenamiento para cualquier interacción. Sin embargo, ten en cuenta que store=false no es compatible con background=true y evita el uso de previous_interaction_id en turnos posteriores.
Puedes borrar las interacciones almacenadas en cualquier momento con el método de eliminación que se encuentra en la Referencia de la API. Solo puedes borrar interacciones si conoces su ID.
Una vez que venza el período de retención, tus datos se borrarán automáticamente.
El sistema procesa los objetos Interaction según las condiciones.
Prácticas recomendadas
- Tasa de aciertos de caché: Usar
previous_interaction_idpara continuar las conversaciones permite que el sistema utilice con mayor facilidad el almacenamiento en caché implícito para el historial de conversaciones, lo que mejora el rendimiento y reduce los costos. - Combinación de interacciones: Tienes la flexibilidad de combinar interacciones del agente y del modelo en una conversación. Por ejemplo, puedes usar un agente especializado, como el agente de Deep Research, para la recopilación inicial de datos y, luego, usar un modelo estándar de Gemini para tareas de seguimiento, como resumir o reformatear, y vincular estos pasos con
previous_interaction_id.
Modelos y agentes compatibles
| Nombre del modelo | Tipo | ID de modelo |
|---|---|---|
| Gemini 3.1 Flash-Lite | Modelo | gemini-3.1-flash-lite |
| Versión preliminar de Gemini 3.1 Flash-Lite | Modelo | gemini-3.1-flash-lite-preview |
| Versión preliminar de Gemini 3.1 Pro | Modelo | gemini-3.1-pro-preview |
| Versión preliminar de Gemini 3 Flash | Modelo | gemini-3-flash-preview |
| Gemini 2.5 Pro | Modelo | gemini-2.5-pro |
| Gemini 2.5 Flash | Modelo | gemini-2.5-flash |
| Gemini 2.5 Flash-lite | Modelo | gemini-2.5-flash-lite |
| Vista previa de clip de Lyria 3 | Modelo | lyria-3-clip-preview |
| Versión preliminar de Lyria 3 Pro | Modelo | lyria-3-pro-preview |
| Versión preliminar de Deep Research | Agente | deep-research-pro-preview-12-2025 |
| Versión preliminar de Deep Research | Agente | deep-research-preview-04-2026 |
| Versión preliminar de Deep Research | Agente | deep-research-max-preview-04-2026 |
SDK
Puedes usar la versión más reciente de los SDKs de IA generativa de Google para acceder a la API de Interactions.
- En Python, este es el paquete
google-genaia partir de la versión1.55.0. - En JavaScript, este es el paquete
@google/genaia partir de la versión1.33.0.
Puedes obtener más información para instalar los SDKs en la página Libraries.
Limitaciones
- Estado beta: La API de Interactions está en versión beta o de vista previa. Las funciones y los esquemas pueden cambiar.
- MCP remoto: Gemini 3 no admite el MCP remoto. Esta función estará disponible pronto.
La API de generateContent admite las siguientes funciones, pero aún no están disponibles en la API de Interactions:
- Metadatos de video: El campo
video_metadata, que se usa para establecer intervalos de recorte y frecuencias de fotogramas personalizadas para la comprensión de videos. - API de Batch
- Llamada a función automática (Python)
- Almacenamiento en caché explícito: Ten en cuenta que el almacenamiento en caché implícito del servidor está disponible en la API de Interactions a través de
previous_interaction_id.
Cambios rotundos
Actualmente, la API de Interactions se encuentra en una etapa de versión beta inicial. Estamos desarrollando y definiendo mejor de forma activa las capacidades de la API, los esquemas de recursos y las interfaces del SDK en función del uso en el mundo real y los comentarios de los desarrolladores.
Como resultado, pueden producirse cambios rotundos. Las actualizaciones pueden incluir cambios en lo siguiente:
- Esquemas de entrada y salida.
- Firmas de métodos y estructuras de objetos del SDK
- Comportamientos específicos de las funciones
Para las cargas de trabajo de producción, debes seguir usando la API de generateContent estándar. Sigue siendo la ruta recomendada para las implementaciones estables, y seguiremos desarrollándola y manteniéndola de forma activa.
Comentarios
Tus comentarios son fundamentales para el desarrollo de la API de Interactions. Comparte tus opiniones, informa errores o solicita funciones en nuestro foro de la comunidad de desarrolladores de IA de Google.
¿Qué sigue?
- Prueba el notebook de inicio rápido de la API de Interactions.
- Obtén más información sobre el agente de Deep Research de Gemini.