Google AI Edge Portal のご紹介: エッジ AI を大規模にベンチマークします。限定公開プレビュー中にアクセスをリクエストするには、登録してください。

Benchmark CompiledModel API

LiteRT ベンチマークツールは、次の重要なパフォーマンス指標の統計情報を測定して計算します。

初期化時間
ウォームアップ状態の推論時間
定常状態の推論時間
初期化時のメモリ使用量
メモリ使用量の全体像

CompiledModel ベンチマークツールは、C++ バイナリ benchmark_model として提供されます。このツールは、Android、Linux、macOS、Windows、GPU アクセラレーションが有効になっている組み込みデバイスのシェルコマンドラインから実行できます。

ビルド済みのベンチマークバイナリをダウンロードする

次のリンクから、ナイトリープリビルドコマンドラインバイナリをダウンロードします。

ソースからベンチマークバイナリをビルドする

ソースからベンチマークバイナリをビルドできます。

bazel build -c opt //litert/tools:benchmark_model

Android NDK ツールチェーンでビルドするには、まずこのガイドに沿ってビルド環境を設定するか、このガイドで説明されているように Docker イメージを使用する必要があります。

bazel build -c opt --config=android_arm64 \
  //litert/tools:benchmark_model

注: ベンチマークのためにバイナリを Android デバイスに直接プッシュして実行することは有効なアプローチですが、実際の Android アプリ内での実行と比較して、パフォーマンスに微妙な（ただし観察可能な）違いが生じる可能性があります。特に、Android のスケジューラは、スレッドとプロセスの優先度に基づいて動作を調整しますが、この優先度は、フォアグラウンドの Activity または Application と、adb shell ... を使用して実行される通常のバックグラウンドバイナリとで異なります。このカスタマイズされた動作は、LiteRT でマルチスレッド CPU 実行を有効にすると最も顕著になります。そのため、パフォーマンス測定には Android ベンチマークアプリが推奨されます。

ベンチマークを実行する

ベンチマークを実行するには、シェルからバイナリを実行します。

path/to/downloaded_or_built/benchmark_model \
  --graph=your_model.tflite \
  --num_threads=4

その他のパラメータオプションについては、benchmark_model のソースコードをご覧ください。

GPU アクセラレーションのベンチマーク

これらのビルド済みバイナリには、LiteRT GPU アクセラレータが含まれています。次の機能に対応しています。

Android: OpenCL
Linux: OpenCL と WebGPU（Vulkan でサポート）
macOS: Metal
Windows: WebGPU（Direct3D を基盤とする）

GPU アクセラレータを使用するには、--use_gpu=true フラグを渡します。

モデルの運用のプロファイリング

ベンチマークモデルのバイナリを使用すると、モデルのオペレーションをプロファイリングして、各オペレーターの実行時間を取得することもできます。これを行うには、呼び出し時にフラグ --use_profiler=true を benchmark_model に渡します。