Codeausführung

Mit der Codeausführungsfunktion der Gemini API kann das Modell Python-Code generieren und ausführen und iterativ aus den Ergebnissen lernen, bis es zu einer endgültigen Ausgabe kommt. Sie können diese Codeausführungsfunktion nutzen, um Anwendungen zu erstellen, die von codebasierten Schlussfolgerungen profitieren und Text ausgeben. Sie könnten beispielsweise Codeausführung in einer Anwendung verwenden, die Gleichungen löst oder Text verarbeitet.

Codeausführung ist sowohl in AI Studio als auch in der Gemini API verfügbar. In AI Studio können Sie die Codeausführung unter Erweiterte Einstellungen aktivieren. Die Gemini API bietet Codeausführung als Tool, ähnlich wie Funktionsaufrufe. Nachdem Sie die Codeausführung als Tool hinzugefügt haben, entscheidet das Modell, wann es verwendet wird.

Erste Schritte bei der Codeausführung

Auf ai.google.dev ansehen In Google Colab ausführen Quelle auf GitHub ansehen

In diesem Abschnitt wird davon ausgegangen, dass Sie ein Gemini SDK installiert und einen API-Schlüssel konfiguriert haben, wie in der quickstart gezeigt.

Codeausführung im Vergleich zu Funktionsaufrufen

Codeausführung und Funktionsaufrufe sind ähnliche Merkmale:

  • Durch die Codeausführung kann das Modell Code im API-Back-End in einer festen, isolierten Umgebung ausführen.
  • Mit Funktionsaufrufen können Sie die vom Modell angeforderten Funktionen in jeder beliebigen Umgebung ausführen.

Im Allgemeinen sollten Sie die Codeausführung verwenden, wenn sie für Ihren Anwendungsfall geeignet ist. Die Codeausführung ist einfacher zu verwenden (Sie aktivieren ihn einfach) und wird in einer einzigen GenerateContent-Anfrage aufgelöst (wobei eine einzige Gebühr anfällt). Funktionsaufrufe erfordern eine zusätzliche GenerateContent-Anfrage, um die Ausgabe jedes Funktionsaufrufs zurückzusenden (dabei fallen mehrere Gebühren an).

In den meisten Fällen sollten Sie Funktionsaufrufe verwenden, wenn Sie eigene Funktionen haben, die Sie lokal ausführen möchten. Verwenden Sie die Codeausführung, wenn die API Python-Code für Sie schreiben und ausführen und das Ergebnis zurückgeben soll.

Abrechnung

Wenn du die Codeausführung über die Gemini API aktivierst, fallen keine zusätzlichen Kosten an. Ihnen werden die aktuellen Ein- und Ausgabe-Tokens in Rechnung gestellt.

Weitere Informationen zur Abrechnung bei Codeausführung:

  • Die Eingabetokens, die Sie an das Modell übergeben, werden Ihnen nur einmal in Rechnung gestellt. Die endgültigen Ausgabetokens, die vom Modell zurückgegeben werden, werden Ihnen in Rechnung gestellt.
  • Tokens, die den generierten Code darstellen, werden als Ausgabetokens gezählt.
  • Ergebnisse der Codeausführung werden auch als Ausgabetoken gezählt.

Beschränkungen

  • Das Modell kann nur Code generieren und ausführen. Andere Artefakte wie Mediendateien können nicht zurückgegeben werden.
  • Datei-E/A und Anwendungsfälle mit nicht textbasierten Ausgaben (z. B. Datendiagramme) werden nicht unterstützt.
  • Die Codeausführung kann maximal 30 Sekunden ausgeführt werden, bevor eine Zeitüberschreitung auftritt.
  • In einigen Fällen kann die Aktivierung der Codeausführung zu Regressionen in anderen Bereichen der Modellausgabe führen (z. B. beim Schreiben einer Story).
  • Die Möglichkeiten der verschiedenen Modelle, die Codeausführung erfolgreich zu nutzen, können unterschiedlich sein. Laut unseren Tests ist Gemini 1.5 Pro das leistungsstärkste Modell.