Gemini API のコード実行機能を使用すると、モデルは Python コードを生成して実行し、その結果から最終出力に到達するまで反復的に学習できます。このコード実行機能を使用すると、コードベースの推論を利用し、テキスト出力を生成するアプリケーションを構築できます。たとえば、方程式を解いたりテキストを処理するアプリケーションでコード実行を使用できます。
コード実行は、AI Studio と Gemini API の両方で使用できます。AI Studio の [詳細設定] で、コード実行を有効にできます。Gemini API は、関数呼び出しと同様に、ツールとしてコードを実行します。コード実行をツールとして追加すると、モデルを使用するタイミングが決定されます。
コード実行を使ってみる
ai.google.dev で表示 | Google Colab で実行 | GitHub のソースを表示 |
このセクションでは、quickstartに示すように、Gemini SDK をインストールして API キーを構成していることを前提としています。
コード実行と関数呼び出し
コード実行と関数呼び出しは似た機能です。
- コード実行を使用すると、モデルは固定された分離された環境で API バックエンドでコードを実行できます。
- 関数呼び出しを使用すると、必要な環境で、モデルがリクエストする関数を実行できます。
一般的に、ユースケースに対応できる場合はコード実行を使用することをおすすめします。コード実行は使いやすく(有効にするだけで済み)、1 つの GenerateContent
リクエストで解決されます(そのため、1 回の料金が発生します)。関数呼び出しでは、追加の GenerateContent
リクエストを受け取り、各関数呼び出しの出力を返します(そのため、複数の料金が発生します)。
ほとんどの場合、ローカルで実行する独自の関数がある場合は関数呼び出しを使用します。また、API で Python コードを記述して実行し、結果を返す場合は、コード実行を使用する必要があります。
請求
Gemini API からコード実行を有効にしても、追加料金は発生しません。入力と出力のトークンの現在のレートで課金されます。
コード実行に対する課金について、次の点にも留意してください。
- モデルに渡した入力トークンに対して 1 回だけ課金され、モデルから返された最終出力トークンに対して課金されます。
- 生成されたコードを表すトークンは、出力トークンとしてカウントされます。
- コード実行の結果も出力トークンとしてカウントされます。
制限事項
- このモデルはコードを生成して実行することしかできません。メディア ファイルなどの他のアーティファクトは返できません。
- この機能は、ファイル I/O やテキスト以外の出力を含むユースケース(データプロットなど)をサポートしていません。
- コード実行は最大 30 秒間実行できます。これを超えるとタイムアウトになります。
- 場合によっては、コード実行を有効にすると、モデル出力の他の領域(ストーリーの作成など)で回帰が発生する可能性があります。
- コード実行を正常に使用するかどうかは、モデルによって異なります。Google のテストによると、Gemini 1.5 Pro は最もパフォーマンスの高いモデルです。