Gemini API のコード実行機能を使用すると、モデルは Python コードを生成して実行し、最終的な出力に到達するまで結果から反復的に学習できます。このコード実行機能を使用すると、コードベースの推論を利用し、テキスト出力を生成するアプリケーションを構築できます。たとえば、方程式を解くアプリやテキストを処理するアプリでコード実行を使用できます。
コード実行は、AI Studio と Gemini API の両方で使用できます。AI Studio の [詳細設定] で、コード実行を有効にできます。Gemini API は、関数呼び出しと同様に、コード実行をツールとして提供します。コード実行をツールとして追加すると、モデルがコード実行を使用するタイミングを決定します。
コード実行の開始
このセクションでは、クイックスタートに記載されている設定手順が完了していることを前提としています。
コードの実行と関数呼び出し
コード実行と関数呼び出しは類似した機能です。
- コード実行により、モデルは固定された分離された環境で API バックエンドのコードを実行できます。
- 関数呼び出しを使用すると、モデルがリクエストする関数を任意の環境で実行できます。
一般的に、ユースケースに対応できる場合はコード実行を使用することをおすすめします。コード実行は使いやすく(有効にするだけ)、1 回の GenerateContent
リクエストで解決されるため(1 回分の料金が発生します)。関数呼び出しでは、各関数呼び出しの出力を送り返すために追加の GenerateContent
リクエストが必要になります(そのため、複数の料金が発生します)。
ほとんどの場合、ローカルで実行する独自の関数がある場合は関数呼び出しを使用し、API で Python コードを記述して実行し、結果を返す場合はコード実行を使用する必要があります。
課金
Gemini API からのコード実行を有効にしても、追加料金は発生しません。入力トークンと出力トークンの現在のレートに基づいて請求されます。
コード実行に対する課金について、次の点にも留意してください。
- モデルに渡す入力トークンは 1 回だけ課金され、モデルから返された最終出力トークンは課金されます。
- 生成されたコードを表すトークンは、出力トークンとしてカウントされます。
- コード実行の結果も出力トークンとしてカウントされます。
制限事項
- モデルはコードの生成と実行のみを行います。メディア ファイルなどの他のアーティファクトは返できません。
- この機能は、ファイル I/O や、テキスト以外の出力(データプロットや CSV ファイルのアップロードなど)を伴うユースケースはサポートしていません。
- コードの実行は、タイムアウトするまで最大 30 秒間実行できます。
- コード実行を有効にすると、モデル出力の他の領域(ストーリーの作成など)で回帰が発生することがあります。
- コード実行を正常に使用できるモデルの能力には、若干のばらつきがあります。Google のテストによると、Gemini 1.5 Pro は最もパフォーマンスの高いモデルです。