La API de Interactions es nuestra nueva interfaz y la forma más sencilla de compilar con modelos y agentes de Gemini. A partir de junio de 2026, estará disponible de forma general y será la interfaz recomendada para todos los proyectos nuevos.
Si bien ahora se considera heredada, la API original
generateContent
sigue siendo totalmente compatible.
¿Por qué usar la API de Interactions?
- Nuevas capacidades listas para usar: Estado de conversación opcional del servidor
con
previous_interaction_id, pasos de ejecución observables para depuración y renderización de la IU, y ejecución en segundo plano para tareas de larga duración conbackground=true. - Menor costo con mayores tasas de aciertos de caché: La administración del estado del servidor permite un almacenamiento en caché de contexto más eficiente en los turnos, lo que reduce los costos de tokens para las conversaciones de varios turnos.
- Diseñada para modelos y agentes de vanguardia: Diseñada específicamente para modelos de pensamiento, uso de herramientas de varios pasos y flujos de razonamiento complejos, lo que simplifica el proceso de compilación, depuración y organización de aplicaciones de agentes.
- Una sola API para modelos y agentes: Una interfaz unificada para llamar directamente a los modelos y agentes de Gemini, como Deep Research y agentes administrados personalizados, sin extremos ni patrones separados para aprender.
- Dónde se lanzan las novedades: En el futuro, los nuevos modelos y capacidades más allá de la familia principal, junto con las nuevas capacidades de agente y herramientas, se lanzarán en la API de Interactions.
De forma predeterminada, la API de Interactions almacena solicitudes para que puedas aprovechar las funciones de administración del estado del servidor con previous_interaction_id. Puedes habilitar el comportamiento sin estado si configuras store=false. Consulta la sección de retención de datos para obtener más
detalles.
Comenzar
- Configura tu agente de programación: Conéctate al MCP de Gemini Docs e instala
la habilidad
gemini-interactions-apipara darle a tu asistente acceso directo a la documentación más reciente para desarrolladores y a las prácticas recomendadas. Configura tu agente de programación → - Migra desde
generateContent: Si tienes una integración existente, sigue la Guía de migración para realizar la transición a la API de Interactions. - Comienza: Consulta la guía de inicio de la API de Interactions guide.
Guías de funciones
Explora las capacidades específicas de la API de Interactions a través de estas guías. Puedes usar el botón de activación en estas páginas para cambiar entre generateContent y la API de Interactions:
- Generación de texto
- Generación de imágenes
- Comprensión de imágenes
- Realizar una comprensión de audio
- Comprensión de videos
- Procesamiento de documentos
- Llamada a función
- Salidas estructuradas
- Agente de Deep Research
- Inferencia flexible
- Inferencia prioritaria
Cómo funciona la API de Interactions
La API de Interactions se centra en un recurso principal: Interaction. Una Interaction representa un turno completo en una conversación o tarea. Actúa como un registro de sesión, que contiene todo el historial de una interacción como una secuencia cronológica de pasos de ejecución. Estos pasos incluyen las ideas del modelo, las llamadas y los resultados de herramientas del servidor o del cliente (como function_call y function_result) y el model_output final. El recurso almacenado (recuperado a través de interactions.get) también incluye pasos user_input para obtener el contexto completo, aunque la respuesta interactions.create solo muestra los pasos generados por el modelo.
Cuando realizas una llamada a
interactions.create, estás
creando un nuevo recurso Interaction.
Administración del estado del servidor
Puedes usar el id de una interacción completada en una llamada posterior con el
previous_interaction_id parámetro para continuar la conversación. El servidor usa este ID para recuperar el historial de conversaciones, lo que te evita tener que volver a enviar todo el historial de chat.
El parámetro previous_interaction_id conserva solo el historial de conversaciones (entradas y salidas) con previous_interaction_id. Los otros parámetros tienen alcance de interacción y solo se aplican a la interacción específica que estás generando en este momento:
toolssystem_instructiongeneration_config(incluidosthinking_level,temperature, etcétera)
Esto significa que debes volver a especificar estos parámetros en cada interacción nueva si deseas que se apliquen. Esta administración del estado del servidor es opcional. También puedes operar en modo sin estado enviando el historial de conversaciones completo en cada solicitud.
Almacenamiento y retención de datos
De forma predeterminada, la API almacena todos los objetos Interaction (store=true) para simplificar el uso de las funciones de administración del estado del servidor (con previous_interaction_id), la ejecución en segundo plano (con background=true) y los fines de observabilidad.
- Nivel pagado: El sistema retiene las interacciones durante 55 días.
- Nivel gratuito: El sistema retiene las interacciones durante 1 día.
Si no quieres esto, puedes configurar store=false en tu solicitud. Este control es independiente de la administración del estado. Puedes inhabilitar el almacenamiento para cualquier interacción. Sin embargo, ten en cuenta que store=false no es compatible con background=true y evita el uso de previous_interaction_id para los turnos posteriores.
Puedes borrar las interacciones almacenadas en cualquier momento con el método delete que se encuentra en la referencia de la API. Solo puedes borrar interacciones si conoces el ID de interacción.
Una vez que venza el período de retención, tus datos se borrarán automáticamente.
El sistema procesa los objetos Interaction según las condiciones.
Prácticas recomendadas
- Tasa de aciertos de caché: El uso de
previous_interaction_idpara continuar las conversaciones permite que el sistema utilice más fácilmente el almacenamiento en caché implícito para el historial de conversaciones, lo que mejora el rendimiento y reduce los costos. - Combinación de interacciones: Tienes la flexibilidad de combinar interacciones de agente y
modelo dentro de una conversación. Por ejemplo, puedes usar un agente especializado, como el agente de Deep Research, para la recopilación inicial de datos y, luego, usar un modelo estándar de Gemini para tareas de seguimiento, como resumir o cambiar el formato, y vincular estos pasos con el
previous_interaction_id.
Modelos y agentes compatibles
| Nombre del modelo | Tipo | ID de modelo |
|---|---|---|
| Gemini 3.1 Flash-Lite | Modelo | gemini-3.1-flash-lite |
| Versión preliminar de Gemini 3.1 Flash-Lite | Modelo | gemini-3.1-flash-lite-preview |
| Versión preliminar de Gemini 3.1 Pro | Modelo | gemini-3.1-pro-preview |
| Versión preliminar de Gemini 3 Flash | Modelo | gemini-3-flash-preview |
| Gemini 2.5 Pro | Modelo | gemini-2.5-pro |
| Gemini 2.5 Flash | Modelo | gemini-2.5-flash |
| Gemini 2.5 Flash-lite | Modelo | gemini-2.5-flash-lite |
| Versión preliminar de Lyria 3 Clip | Modelo | lyria-3-clip-preview |
| Versión preliminar de Lyria 3 Pro | Modelo | lyria-3-pro-preview |
| Versión preliminar de Deep Research | Agente | deep-research-pro-preview-12-2025 |
| Versión preliminar de Deep Research | Agente | deep-research-preview-04-2026 |
| Versión preliminar de Deep Research | Agente | deep-research-max-preview-04-2026 |
| Versión preliminar de Antigravity | Agente | antigravity-preview-05-2026 |
SDK
Puedes usar la versión más reciente de los SDK de IA generativa de Google para acceder a la API de Interactions.
- En Python, este es el paquete
google-genaide la versión1.55.0en adelante. - En JavaScript, este es el paquete
@google/genaide la versión1.33.0en adelante.
Puedes obtener más información para instalar los SDK en la página de bibliotecas.
Limitaciones
- MCP remoto: Gemini 3 no admite MCP remoto. Esta función estará disponible pronto.
La API de
generateContent admite las siguientes funciones, pero aún no están
disponibles en la API de Interactions:
- Metadatos de video: El campo
video_metadata, que se usa para configurar intervalos de recorte y frecuencias de fotogramas personalizadas para la comprensión de videos. - API por lotes
- Llamada a función automática (Python)
- Almacenamiento en caché explícito: Ten en cuenta que el almacenamiento en caché implícito del servidor está disponible en la API de Interactions
a través de
previous_interaction_id.
Comentarios
Tus comentarios son fundamentales para el desarrollo de la API de Interactions. Comparte tus opiniones, informa errores o solicita funciones en nuestro Foro de la comunidad de desarrolladores de Google AI.
¿Qué sigue?
- Prueba el cuaderno de inicio rápido de la API de Interactions.
- Obtén más información sobre el agente de Deep Research de Gemini.