Mit der Codeausführungsfunktion der Gemini API kann das Modell Python-Code generieren und ausführen und iterativ aus den Ergebnissen lernen, bis eine endgültige Ausgabe erreicht wird. Mit dieser Codeausführungsfunktion können Sie Anwendungen erstellen, die von codebasierter Argumentation profitieren und Textausgaben generieren. Sie können die Codeausführung beispielsweise in einer Anwendung verwenden, die Gleichungen löst oder Text verarbeitet.
Die Codeausführung ist sowohl in AI Studio als auch in der Gemini API verfügbar. In AI Studio können Sie die Codeausführung unter Erweiterte Einstellungen aktivieren. Die Gemini API bietet die Codeausführung als Tool, ähnlich wie beim Funktionsaufruf. Nachdem Sie die Codeausführung als Tool hinzugefügt haben, entscheidet das Modell, wann es verwendet werden soll.
Erste Schritte mit der Codeausführung
In diesem Abschnitt wird davon ausgegangen, dass Sie die Einrichtungs- und Konfigurationsschritte in der Kurzanleitung ausgeführt haben.
Codeausführung im Vergleich zum Funktionsaufruf
Die Codeausführung und der Funktionsaufruf sind ähnliche Funktionen:
- Bei der Codeausführung kann das Modell Code im API-Backend in einer festen, isolierten Umgebung ausführen.
- Mit dem Funktionsaufruf können Sie die vom Modell angeforderten Funktionen in einer beliebigen Umgebung ausführen.
Im Allgemeinen sollten Sie die Codeausführung bevorzugen, wenn sie für Ihren Anwendungsfall geeignet ist. Die Codeausführung ist einfacher zu verwenden (Sie müssen sie nur aktivieren) und führt zu einer einzelnen GenerateContent
-Anfrage (d. h., es wird nur einmal abgerechnet). Für den Funktionsaufruf ist eine zusätzliche GenerateContent
-Anfrage erforderlich, um die Ausgabe jedes Funktionsaufrufs zurückzugeben. Dies führt zu mehreren Kosten.
In den meisten Fällen sollten Sie den Funktionsaufruf verwenden, wenn Sie eigene Funktionen haben, die Sie lokal ausführen möchten. Verwenden Sie die Codeausführung, wenn die API Python-Code für Sie schreiben und ausführen und das Ergebnis zurückgeben soll.
Abrechnung
Für die Aktivierung der Codeausführung über die Gemini API fallen keine zusätzlichen Kosten an. Die Abrechnung erfolgt zum aktuellen Preis für Eingabe- und Ausgabetokens.
Weitere Informationen zur Abrechnung der Codeausführung:
- Die Eingabe-Tokens, die Sie an das Modell übergeben, werden Ihnen nur einmal in Rechnung gestellt. Außerdem werden Ihnen die endgültigen Ausgabe-Tokens in Rechnung gestellt, die vom Modell zurückgegeben werden.
- Tokens, die generierten Code darstellen, werden als Ausgabetokens gezählt.
- Auch die Ergebnisse der Codeausführung werden als Ausgabetokens gezählt.
Beschränkungen
- Das Modell kann nur Code generieren und ausführen. Andere Artefakte wie Mediendateien können nicht zurückgegeben werden.
- Die Funktion unterstützt keine Datei-I/O und keine Anwendungsfälle, bei denen keine Textausgabe erfolgt (z. B. Datenplots oder der Upload einer CSV-Datei).
- Die Codeausführung kann maximal 30 Sekunden dauern, bevor eine Zeitüberschreitung auftritt.
- In einigen Fällen kann die Aktivierung der Codeausführung zu Rückschritten in anderen Bereichen der Modellausgabe führen, z. B. beim Schreiben einer Geschichte.
- Die verschiedenen Modelle unterscheiden sich in der Fähigkeit, die Codeausführung erfolgreich zu nutzen. Gemini 1.5 Pro ist laut unseren Tests das leistungsstärkste Modell.