LiteRT 基准测试工具可衡量并计算以下重要性能指标的统计信息:
- 初始化时间
- 预热状态的推理时间
- 稳态的推理时间
- 初始化期间的内存用量
- 总体内存用量
CompiledModel 基准测试工具以 C++ 二进制文件 benchmark_model 的形式提供。您可以在 Android、Linux、macOS、Windows 和已启用 GPU 加速的嵌入式设备上通过 shell 命令行执行此工具。
下载预构建的基准二进制文件
通过点击以下链接下载每晚预构建的命令行二进制文件:
从源代码构建基准二进制文件
您可以从源代码构建基准二进制文件。
bazel build -c opt //litert/tools:benchmark_model
如需使用 Android NDK 工具链进行构建,您需要先按照此指南设置构建环境,或使用此指南中所述的 Docker 映像。
bazel build -c opt --config=android_arm64 \
//litert/tools:benchmark_model
运行基准测试
如需运行基准,请从 shell 执行二进制文件。
path/to/downloaded_or_built/benchmark_model \
--graph=your_model.tflite \
--num_threads=4
如需了解更多参数选项,请参阅 benchmark_model 的源代码。
对 GPU 加速进行基准比较
这些预构建的二进制文件包括 LiteRT GPU 加速器。它支持
- Android:OpenCL
- Linux:OpenCL 和 WebGPU(由 Vulkan 提供支持)
- macOS:Metal
- Windows:WebGPU(由 Direct3D 提供支持)
如需使用 GPU 加速器,请传递标志 --use_gpu=true。
分析模型操作
基准模型二进制文件还可用于分析模型操作,并获取每个运算符的执行时间。为此,请在调用期间向 benchmark_model 传递标志 --use_profiler=true。