Descripción general de los agentes

Los agentes administrados en la API de Gemini te brindan un arnés de agente configurable. Una sola llamada a la API aprovisiona una zona de pruebas de Linux en la que el agente razona, ejecuta código, administra archivos y navega por la Web de forma autónoma.

Agentes administrados disponibles

Seguridad y prácticas recomendadas

Cada agente se ejecuta en un entorno de zona de pruebas aislado a nivel del SO. De forma predeterminada, la zona de pruebas tiene acceso de red saliente sin restricciones. Puedes restringir o inhabilitar el acceso a la red con una lista de entidades permitidas.

Acceso a la red

De forma predeterminada, los entornos tienen acceso de red saliente sin restricciones. Usa una lista de entidades permitidas network para restringir el tráfico saliente a dominios específicos o patrones comodín. Para obtener detalles sobre la configuración, consulta Lista de entidades permitidas de red (AI Studio) o Reglas de red (API).

Herramientas y APIs externas

Puedes conectar herramientas y APIs externas para extender el agente. Usa solo herramientas de fuentes confiables y permisos de alcance al mínimo requerido. Las credenciales se pueden insertar de forma segura a través de transformaciones de encabezado de proxy de salida y nunca se exponen dentro de la zona de pruebas. El agente puede usar cualquier credencial a la que tenga acceso, por lo que solo debes proporcionar credenciales cuyo alcance completo estés dispuesto a otorgar.

  • Usa cuentas de servicio o claves de API con privilegios mínimos.
  • Prefiere los tokens de corta duración a las claves de larga duración.
  • Solo proporciona credenciales cuyo alcance completo estés dispuesto a otorgar.
  • Rota las credenciales con regularidad.

Para obtener detalles sobre la configuración de las transformaciones de encabezado, consulta Credenciales.

Supervisión humana

Siempre verifica los resultados (código generado, transformaciones de datos, cambios de configuración) antes de implementarlos, en especial para las tareas que modifican datos o interactúan con sistemas externos.

Precios

Los agentes administrados usan un modelo de pago por uso basado en tokens del modelo de Gemini y uso de herramientas. Una sola interacción puede activar varios bucles de razonamiento, que suelen consumir entre 100,000 y 3 millones de tokens. El procesamiento del entorno no se factura durante la versión preliminar. Consulta los costos estimados para los desgloses por tarea.

Límites

Límite Descripción
Tiempo de actividad del entorno Los entornos se borran de forma permanente después de 7 días de inactividad.
Apagado de VM Las VMs se apagan después de un breve período de inactividad para conservar los recursos. La siguiente solicitud restablece el estado (con un inicio en frío).
Software preinstalado Entorno basado en Ubuntu con Python 3.12 y Node.js 22. Para obtener más información sobre la imagen base del entorno, consulta Software preinstalado.
Cantidad máxima de agentes Puedes tener hasta 1,000 agentes administrados.

Frameworks de agentes

También puedes crear agentes con Gemini usando estos frameworks y SDKs:

  • **LangChain / LangGraph**: Crea flujos de aplicaciones complejos con estado y sistemas multiagente con estructuras de gráficos.
  • LlamaIndex: Conecta agentes de Gemini a tus datos privados para flujos de trabajo mejorados con RAG.
  • CrewAI: Organiza agentes de IA autónomos y colaborativos que interpretan roles.
  • SDK de IA de Vercel: Crea interfaces de usuario y agentes con tecnología de IA en JavaScript o TypeScript.
  • **ADK de Google**: Es un framework de código abierto para crear y organizar agentes de IA interoperables.
  • SDK de Antigravity: Crea agentes de IA autónomos con las mismas herramientas, bucle de agente y administración de contexto que impulsan Google Antigravity, programable en Python.