コードの実行

Gemini API のコード実行機能を使用すると、モデルは Python コードを生成して実行し、その結果から最終出力に到達するまで反復的に学習できます。このコード実行機能を使用すると、コードベースの推論を活用し、テキスト出力を生成するアプリケーションを構築できます。たとえば、方程式を解くアプリケーションやテキストを処理するアプリケーションでコード実行を使用できます。

コード実行は、AI Studio と Gemini API の両方で使用できます。AI Studio の右側のパネルの [ツール] で、コード実行を有効にできます。Gemini API は、関数呼び出しと同様に、ツールとしてコードを実行します。コード実行をツールとして追加すると、モデルを使用するタイミングが決定されます。

コード実行環境には、altairchesscv2matplotlibmpmathnumpypandaspdfminerreportlabseabornsklearnstatsmodelsstriprtfsympytabulate のライブラリが含まれています。独自のライブラリはインストールできません。

始める前に

Gemini API を呼び出す前に、任意の SDK がインストールされ、Gemini API キーが構成され、使用可能であることを確認してください。

コード実行の開始

入出力(I/O)

Gemini 2.0 Flash 以降、コード実行はファイル入力とグラフ出力をサポートしています。これらの新しい入出力機能を使用して、CSV ファイルとテキスト ファイルをアップロードしたり、ファイルについて質問したり、レスポンスの一部として Matplotlib グラフを生成したりすることができます。

I/O の料金

コード実行 I/O を使用する場合は、入力トークンと出力トークンに対して課金されます。

入力トークン:

  • ユーザーによるプロンプト

出力トークン:

  • モデルによって生成されたコード
  • コード環境でのコード実行出力
  • モデルによって生成された要約

I/O の詳細

コード実行 I/O を使用する場合は、次の技術的な詳細に注意してください。

  • コード環境の最大実行時間は 30 秒です。
  • コード環境でエラーが発生した場合、モデルはコード出力の再生成を決定することがあります。この処理は 5 回まで発生することがあります。
  • 最大ファイル入力サイズは、モデルトークン ウィンドウによって制限されます。AI Studio で Gemini Flash 2.0 を使用する場合、最大入力ファイルサイズは 100 万トークン(サポートされている入力タイプのテキスト ファイルの場合は約 2 MB)です。アップロードするファイルが大きすぎると、送信できません。
シングルターン 双方向(Multimodal Live API)
サポートされているモデル すべての Gemini 2.0 モデル Flash の試験運用版モデルのみ
サポートされているファイル入力タイプ .png、.jpeg、.csv、.xml、.cpp、.java、.py、.js、.ts .png、.jpeg、.csv、.xml、.cpp、.java、.py、.js、.ts
サポートされているライブラリのプロット Matplotlib Matplotlib
マルチツールの使用 いいえ

課金

Gemini API からコード実行を有効にしても、追加料金は発生しません。 使用している Gemini モデルに基づいて、入力トークンと出力トークンの現在のレートで課金されます。

コード実行の課金に関するその他の注意事項は次のとおりです。

  • モデルに渡した入力トークンに対して 1 回だけ課金され、モデルから返された最終出力トークンに対して課金されます。
  • 生成されたコードを表すトークンは、出力トークンとしてカウントされます。生成されるコードには、テキストと、画像などのマルチモーダル出力を含めることができます。
  • コード実行の結果も出力トークンとしてカウントされます。

次の図に課金モデルを示します。

コード実行の課金モデル

  • 使用している Gemini モデルに基づいて、入力トークンと出力トークンの現在のレートで課金されます。
  • Gemini がレスポンスの生成時にコード実行を使用する場合、元のプロンプト、生成されたコード、実行されたコードの結果には中間トークンのラベルが付けられ、入力トークンとして課金されます。
  • Gemini はサマリーを生成し、生成されたコード、実行されたコードの結果、最終的なサマリーを返します。これらは出力トークンとして課金されます。
  • Gemini API では API レスポンスに中間トークン数が含まれているため、最初のプロンプト以外の入力トークンを取得する理由を確認できます。

制限事項

  • モデルはコードの生成と実行のみが可能です。メディア ファイルなど、他のアーティファクトを返すことはできません。
  • 場合によっては、コード実行を有効にすると、モデル出力の他の領域(ストーリーの作成など)で回帰が発生する可能性があります。
  • コード実行を正常に使用するかどうかは、モデルによって異なります。