Mit der Codeausführungsfunktion der Gemini API kann das Modell Python-Code generieren und ausführen und iterativ aus den Ergebnissen lernen, bis eine endgültige Ausgabe erreicht wird. Mit dieser Codeausführungsfunktion können Sie Anwendungen erstellen, die von codebasierter Argumentation profitieren und Textausgaben generieren. Sie können die Codeausführung beispielsweise in einer Anwendung verwenden, die Gleichungen löst oder Text verarbeitet.
Die Codeausführung ist sowohl in AI Studio als auch in der Gemini API verfügbar. In AI Studio können Sie die Codeausführung unter Erweiterte Einstellungen aktivieren. Die Gemini API bietet die Codeausführung als Tool, ähnlich wie beim Funktionsaufruf. Nachdem Sie die Codeausführung als Tool hinzugefügt haben, entscheidet das Modell, wann es verwendet werden soll.
Erste Schritte bei der Codeausführung
In diesem Abschnitt wird davon ausgegangen, dass Sie die Einrichtungs- und Konfigurationsschritte in der Kurzanleitung ausgeführt haben.
Codeausführung im Vergleich zum Funktionsaufruf
Die Codeausführung und der Funktionsaufruf sind ähnliche Funktionen:
- Durch die Codeausführung kann das Modell Code im API-Back-End in einer festen, isolierten Umgebung ausführen.
- Mit Funktionsaufrufen können Sie die vom Modell angeforderten Funktionen in jeder beliebigen Umgebung ausführen.
Im Allgemeinen sollten Sie die Codeausführung bevorzugen, wenn sie für Ihren Anwendungsfall geeignet ist. Die Codeausführung ist einfacher zu verwenden (Sie müssen sie nur aktivieren) und führt zu einer einzelnen GenerateContent
-Anfrage (d. h., es wird nur einmal abgerechnet). Für den Funktionsaufruf ist eine zusätzliche GenerateContent
-Anfrage erforderlich, um die Ausgabe jedes Funktionsaufrufs zurückzugeben. Dies führt zu mehreren Abbuchungen.
In den meisten Fällen sollten Sie Funktionsaufrufe verwenden, wenn Sie eigene Funktionen haben, die Sie lokal ausführen möchten. Verwenden Sie die Codeausführung, wenn die API Python-Code für Sie schreiben und ausführen und das Ergebnis zurückgeben soll.
Abrechnung
Für die Aktivierung der Codeausführung über die Gemini API fallen keine zusätzlichen Kosten an. Die Abrechnung erfolgt zum aktuellen Preis für Eingabe- und Ausgabetokens.
Weitere Informationen zur Abrechnung der Codeausführung:
- Sie werden nur einmal für die Eingabe-Tokens in Rechnung gestellt, die Sie an das Modell übergeben. Außerdem werden Ihnen die endgültigen Ausgabe-Tokens in Rechnung gestellt, die vom Modell zurückgegeben werden.
- Tokens, die generierten Code darstellen, werden als Ausgabetokens gezählt.
- Auch die Ergebnisse der Codeausführung werden als Ausgabetokens gezählt.
Beschränkungen
- Das Modell kann nur Code generieren und ausführen. Andere Artefakte wie Mediendateien können nicht zurückgegeben werden.
- Die Funktion unterstützt keine Datei-I/O oder Anwendungsfälle, bei denen keine Textausgabe erfolgt (z. B. Datenplots oder CSV-Dateiuploads).
- Die Codeausführung kann maximal 30 Sekunden dauern, bevor eine Zeitüberschreitung auftritt.
- In einigen Fällen kann die Aktivierung der Codeausführung zu Rückschritten in anderen Bereichen der Modellausgabe führen, z. B. beim Schreiben einer Geschichte.
- Die verschiedenen Modelle unterscheiden sich in der Fähigkeit, die Codeausführung erfolgreich zu nutzen. Gemini 1.5 Pro ist laut unseren Tests das leistungsstärkste Modell.