La fonctionnalité d'exécution de code de l'API Gemini permet au modèle de générer et d'exécuter du code Python, et d'apprendre de manière itérée à partir des résultats jusqu'à obtenir un résultat final. Vous pouvez utiliser cette fonctionnalité d'exécution de code pour créer des applications qui bénéficient du raisonnement basé sur le code et qui produisent une sortie textuelle. Par exemple, vous pouvez utiliser l'exécution de code dans une application qui résout des équations ou traite du texte.
L'exécution du code est disponible à la fois dans AI Studio et dans l'API Gemini. Dans AI Studio, vous pouvez activer l'exécution du code sous Paramètres avancés. L'API Gemini fournit l'exécution de code en tant qu'outil, semblable à l'appel de fonction. Une fois que vous avez ajouté l'exécution de code en tant qu'outil, le modèle décide quand l'utiliser.
Premiers pas avec l'exécution de code
Cette section suppose que vous avez suivi les étapes de configuration et de configuration décrites dans le guide de démarrage rapide.
Exécution de code par rapport à l'appel de fonction
L'exécution de code et l'appel de fonction sont des fonctionnalités similaires:
- L'exécution du code permet au modèle d'exécuter du code dans le backend de l'API dans un environnement fixe et isolé.
- L'appel de fonction vous permet d'exécuter les fonctions que le modèle demande, dans l'environnement de votre choix.
En règle générale, vous devez préférer l'exécution de code si elle peut gérer votre cas d'utilisation. L'exécution de code est plus simple à utiliser (il vous suffit de l'activer) et se résout en une seule requête GenerateContent
(ce qui entraîne une seule facturation). L'appel de fonction nécessite une requête GenerateContent
supplémentaire pour renvoyer la sortie de chaque appel de fonction (ce qui entraîne plusieurs frais).
Dans la plupart des cas, vous devez utiliser l'appel de fonction si vous avez vos propres fonctions que vous souhaitez exécuter localement. Vous devez également utiliser l'exécution de code si vous souhaitez que l'API écrive et exécute du code Python à votre place et renvoie le résultat.
Facturation
L'activation de l'exécution de code à partir de l'API Gemini n'entraîne aucun coût supplémentaire. Vous serez facturé au tarif actuel des jetons d'entrée et de sortie.
Voici quelques autres points à connaître concernant la facturation de l'exécution du code:
- Vous ne serez facturé qu'une seule fois pour les jetons d'entrée que vous transmettez au modèle, et pour les jetons de sortie finaux qui vous sont renvoyés par le modèle.
- Les jetons représentant du code généré sont comptabilisés comme des jetons de sortie.
- Les résultats de l'exécution du code sont également comptabilisés comme des jetons de sortie.
Limites
- Le modèle ne peut générer et exécuter du code que. Il ne peut pas renvoyer d'autres artefacts tels que des fichiers multimédias.
- Cette fonctionnalité n'est pas compatible avec l'E/S de fichiers ni avec les cas d'utilisation impliquant une sortie autre que textuelle (par exemple, des graphiques de données ou une importation de fichier CSV).
- L'exécution du code peut s'exécuter pendant 30 secondes maximum avant expiration du délai.
- Dans certains cas, l'activation de l'exécution de code peut entraîner des régressions dans d'autres domaines de la sortie du modèle (par exemple, l'écriture d'une histoire).
- La capacité des différents modèles à utiliser l'exécution de code avec succès varie. Gemini 1.5 Pro est le modèle le plus performant, d'après nos tests.