La función de ejecución de código de la API de Gemini permite que el modelo genere y ejecute código de Python, y aprenda de forma iterativa a partir de los resultados hasta llegar a un resultado final. Puedes usar esta función de ejecución de código para compilar aplicaciones que se beneficien del razonamiento basado en código y que produzcan resultados de texto. Para Por ejemplo, podrías usar la ejecución del código en una aplicación que resuelva ecuaciones o procesa texto.
La ejecución de código está disponible en AI Studio y en la API de Gemini. En AI Studio, puedes habilitar la ejecución de código en Configuración avanzada. La API de Gemini proporciona la ejecución del código como herramienta, similar a llamada a función. Después de agregar la ejecución de código como una herramienta, el modelo decide cuándo usarla.
Comienza a usar la ejecución de código
En esta sección, se supone que instalaste un SDK de Gemini y configuraste una clave de API, como se muestra en la guía de inicio rápido.
Ejecución de código frente a llamada a funciones
La ejecución de código y las llamadas a función son funciones similares:
- La ejecución de código permite que el modelo ejecute código en el backend de la API de forma fija y aislada en un entorno de nube.
- Las llamadas a función te permiten ejecutar las funciones que solicita el modelo, en el entorno que desees.
En general, deberías optar por la ejecución de código si puede controlar tu uso.
para determinar si este es el caso. La ejecución de código es más fácil de usar (solo tienes que habilitarla) y se resuelve en una sola solicitud de GenerateContent
(por lo que se genera un solo cargo). Función
La llamada toma una solicitud GenerateContent
adicional para devolver el resultado
de cada llamada a función (lo que genera varios cargos).
En la mayoría de los casos, debes usar llamadas a función si tienes tus propias funciones que deseas ejecutar de forma local y debes usar la ejecución de código si deseas que la API escriba y ejecute código Python por ti y muestre el resultado.
Facturación
No se cobra ningún cargo adicional por habilitar la ejecución de código desde la API de Gemini. Se te facturará según la tarifa actual de entrada y salida tokens.
Estos son otros aspectos que debes conocer sobre la facturación para la ejecución del código:
- Solo se te facturará una vez por los tokens de entrada que pases al modelo. se te factura por los tokens de salida finales que te devolvió el modelo.
- Los tokens que representan el código generado se cuentan como tokens de salida.
- Los resultados de la ejecución de código también se cuentan como tokens de salida.
Limitaciones
- El modelo solo puede generar y ejecutar código. No puede mostrar otros artefactos como archivos multimedia.
- La función no admite E/S de archivos ni casos de uso que involucren resultados que no sean de texto (por ejemplo, gráficos de datos o una carga de archivo CSV).
- La ejecución de código puede ejecutarse durante un máximo de 30 segundos antes de que se agote el tiempo de espera.
- En algunos casos, habilitar la ejecución del código puede generar regresiones en otras áreas de salida del modelo (por ejemplo, escribir una historia).
- Hay cierta variación en la capacidad de los diferentes modelos para usar la ejecución de código con éxito. Según nuestras pruebas, Gemini 1.5 Pro es el modelo con el mejor rendimiento.