Ejecución de código

La función de ejecución de código de la API de Gemini permite que el modelo genere y ejecute código de Python, y aprenda de forma iterativa a partir de los resultados hasta que llegue a un resultado final. Puedes usar esta capacidad de ejecución de código para compilar aplicaciones que se beneficien del razonamiento basado en código y que produzcan salidas de texto. Por ejemplo, puedes usar la ejecución de código en una aplicación que resuelva ecuaciones o procese texto.

La ejecución de código está disponible en AI Studio y la API de Gemini. En AI Studio, puedes habilitar la ejecución de código en Configuración avanzada. La API de Gemini proporciona la ejecución de código como herramienta, de forma similar a la llamada a funciones. Después de agregar la ejecución del código como herramienta, el modelo decide cuándo usarla.

Comienza a ejecutar código

Ver en ai.google.dev Ejecutar en Google Colab Ver el código fuente en GitHub

En esta sección, se da por sentado que instalaste un SDK de Gemini y configuraste una clave de API, como se muestra en la quickstart.

Ejecución de código frente a llamada a funciones

La ejecución de código y la llamada a funciones son características similares:

  • La ejecución de código permite que el modelo ejecute código en el backend de la API en un entorno fijo y aislado.
  • Las llamadas a función te permiten ejecutar las funciones que solicita el modelo, en el entorno que desees.

En general, deberías optar por la ejecución de código si puede controlar tu caso de uso. La ejecución del código es más fácil de usar (solo la habilitas) y se resuelve en una sola solicitud GenerateContent (por lo tanto, se cobra un solo cargo). Las llamadas a función requieren una solicitud GenerateContent adicional para devolver el resultado de cada llamada a función (lo que genera varios cargos).

En la mayoría de los casos, debes usar la llamada a función si tienes tus propias funciones que deseas ejecutar de forma local y debes usar la ejecución de código si deseas que la API escriba y ejecute código de Python por ti y muestre el resultado.

Facturación

No se aplican cargos adicionales por habilitar la ejecución de código desde la API de Gemini. Se te facturará según la tarifa actual de tokens de entrada y salida.

Estos son otros aspectos que debes conocer sobre la facturación para la ejecución del código:

  • Solo se te factura una vez por los tokens de entrada que pasas al modelo y se facturan los tokens de salida finales que te devolvió el modelo.
  • Los tokens que representan el código generado se cuentan como tokens de salida.
  • Los resultados de la ejecución de código también se cuentan como tokens de salida.

Limitaciones

  • El modelo solo puede generar y ejecutar código. No puede mostrar otros artefactos, como archivos multimedia.
  • La función no admite E/S de archivos ni casos de uso que involucren salidas que no sean de texto (por ejemplo, diagramas de datos).
  • La ejecución del código puede ejecutarse durante un máximo de 30 segundos antes de que se agote el tiempo de espera.
  • En algunos casos, habilitar la ejecución de código puede generar regresiones en otras áreas del resultado del modelo (por ejemplo, escribir una historia).
  • Existe cierta variación en la capacidad de los diferentes modelos para usar la ejecución de código con éxito. Gemini 1.5 Pro es el modelo de mejor rendimiento según nuestras pruebas.