コード実行

Gemini API のコード実行機能を使用すると、モデルは Python コードを生成して実行し、最終的な出力に到達するまで結果から反復的に学習できます。このコード実行機能を使用すると、コードベースの推論を活用し、テキスト出力を生成するアプリケーションを構築できます。たとえば、方程式を解くアプリやテキストを処理するアプリでコード実行を使用できます。

コード実行は、AI Studio と Gemini API の両方で使用できます。AI Studio では、[詳細設定] でコード実行を有効にできます。Gemini API は、関数呼び出しと同様に、コード実行をツールとして提供します。コード実行をツールとして追加すると、モデルがコード実行を使用するタイミングを決定します。

コード実行の開始

このセクションでは、クイックスタートで説明されている設定手順が完了していることを前提としています。

コードの実行と関数呼び出し

コード実行と関数呼び出しは類似した機能です。

  • コード実行により、モデルは固定された分離された環境で API バックエンド内のコードを実行できます。
  • 関数呼び出しを使用すると、モデルがリクエストする関数を任意の環境で実行できます。

一般に、ユースケースを処理できる場合は、コード実行を使用することをおすすめします。コード実行は使いやすく(有効にするだけ)、1 回の GenerateContent リクエストで解決されるため(1 回分の料金が発生します)。関数呼び出しでは、各関数呼び出しの出力を送り返すために追加の GenerateContent リクエストが必要になります(そのため、複数の料金が発生します)。

ほとんどの場合、ローカルで実行する独自の関数がある場合は関数呼び出しを使用し、API で Python コードを記述して実行し、結果を返す場合はコード実行を使用する必要があります。

課金

Gemini API からのコード実行を有効にしても、追加料金は発生しません。入力トークンと出力トークンの現在のレートに基づいて請求されます。

コード実行の課金について、その他の注意事項は次のとおりです。

  • モデルに渡す入力トークンは 1 回だけ課金され、モデルから返された最終出力トークンは課金されます。
  • 生成されたコードを表すトークンは、出力トークンとしてカウントされます。
  • コード実行結果も出力トークンとしてカウントされます。

制限事項

  • モデルはコードの生成と実行のみを行います。メディア ファイルなどの他のアーティファクトを返すことはできません。
  • この機能は、ファイル I/O や、テキスト以外の出力(データのグラフや CSV ファイルのアップロードなど)を伴うユースケースはサポートしていません。
  • コードの実行は、タイムアウトするまで最大 30 秒間実行できます。
  • コード実行を有効にすると、モデル出力の他の領域(ストーリーの作成など)で回帰が発生することがあります。
  • コード実行を正常に使用できるモデルの能力には、若干のばらつきがあります。Google のテストでは、Gemini 1.5 Pro が最も優れたパフォーマンスを発揮しました。