TensorFlow Lite 바이너리 크기 줄이기

개요

기기 내 머신러닝 (ODML) 애플리케이션을 위한 모델을 배포할 때는 휴대기기에서 사용할 수 있는 제한된 메모리에 유의해야 합니다. 모델 바이너리 크기는 모델에 사용되는 작업 수와 밀접한 상관관계가 있습니다. TensorFlow Lite를 사용하면 선택적 빌드를 사용하여 모델 바이너리 크기를 줄일 수 있습니다. 선택적 빌드는 모델 세트에서 사용되지 않는 작업을 건너뛰고 모델을 휴대기기에서 실행하는 데 필요한 런타임 및 작업 커널만 포함된 소형 라이브러리를 생성합니다.

선택적 빌드는 다음 세 가지 작업 라이브러리에 적용됩니다.

  1. TensorFlow Lite 기본 제공 작업 라이브러리
  2. TensorFlow Lite 맞춤 작업
  3. TensorFlow 작업 라이브러리 선택

아래 표는 선택적 빌드가 몇 가지 일반적인 사용 사례에 미치는 영향을 보여줍니다.

모델 이름 도메인 대상 아키텍처 AAR 파일 크기
Mobilenet_1.0_224(float) 이미지 분류 armeabi-v7a tensorflow-lite.aar (296,635바이트)
arm64-v8a tensorflow-lite.aar (382,892바이트)
사본 음높이 추출 armeabi-v7a tensorflow-lite.aar (375,813바이트)
tensorflow-lite-select-tf-ops.aar (1,676,380바이트)
arm64-v8a tensorflow-lite.aar (421,826바이트)
tensorflow-lite-select-tf-ops.aar (2,298,630바이트)
i3d-kineras-400 동영상 분류 armeabi-v7a tensorflow-lite.aar (240,085바이트)
tensorflow-lite-select-tf-ops.aar (1,708,597바이트)
arm64-v8a tensorflow-lite.aar (273,713바이트)
tensorflow-lite-select-tf-ops.aar (2,339,697바이트)

Bazel을 사용하여 선택적으로 TensorFlow Lite 빌드

이 섹션에서는 TensorFlow 소스 코드를 다운로드하고 Bazel에 로컬 개발 환경을 설정했다고 가정합니다.

Android 프로젝트용 AAR 파일 빌드

다음과 같이 모델 파일 경로를 제공하여 커스텀 TensorFlow Lite AAR을 빌드할 수 있습니다.

sh tensorflow/lite/tools/build_aar.sh \
  --input_models=/a/b/model_one.tflite,/c/d/model_two.tflite \
  --target_archs=x86,x86_64,arm64-v8a,armeabi-v7a

위의 명령어는 TensorFlow Lite 기본 제공 및 맞춤 작업을 위한 AAR 파일 bazel-bin/tmp/tensorflow-lite.aar을 생성하고, 선택적으로 모델에 TensorFlow 선택 작업이 포함된 경우 aar 파일 bazel-bin/tmp/tensorflow-lite-select-tf-ops.aar을 생성합니다. 이 방법은 여러 가지 다른 아키텍처로 '많은' AAR을 구축합니다. 이 모든 아키텍처가 필요하지 않은 경우 배포 환경에 적합한 하위 집합을 사용하세요.

커스텀 작업으로 빌드

커스텀 작업으로 TensorFlow Lite 모델을 개발한 경우 빌드 명령어에 다음 플래그를 추가하여 빌드할 수 있습니다.

sh tensorflow/lite/tools/build_aar.sh \
  --input_models=/a/b/model_one.tflite,/c/d/model_two.tflite \
  --target_archs=x86,x86_64,arm64-v8a,armeabi-v7a \
  --tflite_custom_ops_srcs=/e/f/file1.cc,/g/h/file2.h \
  --tflite_custom_ops_deps=dep1,dep2

tflite_custom_ops_srcs 플래그에는 커스텀 작업의 소스 파일이 포함되며 tflite_custom_ops_deps 플래그에는 이러한 소스 파일을 빌드하기 위한 종속 항목이 포함됩니다. 이러한 종속 항목은 TensorFlow 저장소에 있어야 합니다.

고급 사용법: 커스텀 Bazel 규칙

프로젝트에서 Bazel을 사용하고 있고 주어진 모델 세트에 커스텀 TFLite 종속 항목을 정의하려는 경우 프로젝트 저장소에서 다음 규칙을 정의할 수 있습니다.

기본 제공 작업이 있는 모델만 해당:

load(
    "@org_tensorflow//tensorflow/lite:build_def.bzl",
    "tflite_custom_android_library",
    "tflite_custom_c_library",
    "tflite_custom_cc_library",
)

# A selectively built TFLite Android library.
tflite_custom_android_library(
    name = "selectively_built_android_lib",
    models = [
        ":model_one.tflite",
        ":model_two.tflite",
    ],
)

# A selectively built TFLite C library.
tflite_custom_c_library(
    name = "selectively_built_c_lib",
    models = [
        ":model_one.tflite",
        ":model_two.tflite",
    ],
)

# A selectively built TFLite C++ library.
tflite_custom_cc_library(
    name = "selectively_built_cc_lib",
    models = [
        ":model_one.tflite",
        ":model_two.tflite",
    ],
)

TF 작업 선택이 포함된 모델:

load(
    "@org_tensorflow//tensorflow/lite/delegates/flex:build_def.bzl",
    "tflite_flex_android_library",
    "tflite_flex_cc_library",
)

# A Select TF ops enabled selectively built TFLite Android library.
tflite_flex_android_library(
    name = "selective_built_tflite_flex_android_lib",
    models = [
        ":model_one.tflite",
        ":model_two.tflite",
    ],
)

# A Select TF ops enabled selectively built TFLite C++ library.
tflite_flex_cc_library(
    name = "selective_built_tflite_flex_cc_lib",
    models = [
        ":model_one.tflite",
        ":model_two.tflite",
    ],
)

고급 사용법: 맞춤 C/C++ 공유 라이브러리 빌드

지정된 모델에 자체 맞춤 TFLite C/C++ 공유 객체를 빌드하려면 다음 단계를 따르세요.

TensorFlow 소스 코드의 루트 디렉터리에서 다음 명령어를 실행하여 임시 BUILD 파일을 만듭니다.

mkdir -p tmp && touch tmp/BUILD

맞춤 C 공유 객체 빌드

맞춤 TFLite C 공유 객체를 빌드하려면 tmp/BUILD 파일에 다음을 추가합니다.

load(
    "//tensorflow/lite:build_def.bzl",
    "tflite_custom_c_library",
    "tflite_cc_shared_object",
)

tflite_custom_c_library(
    name = "selectively_built_c_lib",
    models = [
        ":model_one.tflite",
        ":model_two.tflite",
    ],
)

# Generates a platform-specific shared library containing the TensorFlow Lite C
# API implementation as define in `c_api.h`. The exact output library name
# is platform dependent:
#   - Linux/Android: `libtensorflowlite_c.so`
#   - Mac: `libtensorflowlite_c.dylib`
#   - Windows: `tensorflowlite_c.dll`
tflite_cc_shared_object(
    name = "tensorflowlite_c",
    linkopts = select({
        "//tensorflow:ios": [
            "-Wl,-exported_symbols_list,$(location //tensorflow/lite/c:exported_symbols.lds)",
        ],
        "//tensorflow:macos": [
            "-Wl,-exported_symbols_list,$(location //tensorflow/lite/c:exported_symbols.lds)",
        ],
        "//tensorflow:windows": [],
        "//conditions:default": [
            "-z defs",
            "-Wl,--version-script,$(location //tensorflow/lite/c:version_script.lds)",
        ],
    }),
    per_os_targets = True,
    deps = [
        ":selectively_built_c_lib",
        "//tensorflow/lite/c:exported_symbols.lds",
        "//tensorflow/lite/c:version_script.lds",
    ],
)

새로 추가된 대상은 다음과 같이 빌드할 수 있습니다.

bazel build -c opt --cxxopt=--std=c++17 \
  //tmp:tensorflowlite_c

Android의 경우 (64비트의 경우 android_armandroid_arm64로 대체):

bazel build -c opt --cxxopt=--std=c++17 --config=android_arm \
  //tmp:tensorflowlite_c

맞춤 C++ 공유 객체 빌드

맞춤 TFLite C++ 공유 객체를 빌드하려면 tmp/BUILD 파일에 다음을 추가합니다.

load(
    "//tensorflow/lite:build_def.bzl",
    "tflite_custom_cc_library",
    "tflite_cc_shared_object",
)

tflite_custom_cc_library(
    name = "selectively_built_cc_lib",
    models = [
        ":model_one.tflite",
        ":model_two.tflite",
    ],
)

# Shared lib target for convenience, pulls in the core runtime and builtin ops.
# Note: This target is not yet finalized, and the exact set of exported (C/C++)
# APIs is subject to change. The output library name is platform dependent:
#   - Linux/Android: `libtensorflowlite.so`
#   - Mac: `libtensorflowlite.dylib`
#   - Windows: `tensorflowlite.dll`
tflite_cc_shared_object(
    name = "tensorflowlite",
    # Until we have more granular symbol export for the C++ API on Windows,
    # export all symbols.
    features = ["windows_export_all_symbols"],
    linkopts = select({
        "//tensorflow:macos": [
            "-Wl,-exported_symbols_list,$(location //tensorflow/lite:tflite_exported_symbols.lds)",
        ],
        "//tensorflow:windows": [],
        "//conditions:default": [
            "-Wl,-z,defs",
            "-Wl,--version-script,$(location //tensorflow/lite:tflite_version_script.lds)",
        ],
    }),
    per_os_targets = True,
    deps = [
        ":selectively_built_cc_lib",
        "//tensorflow/lite:tflite_exported_symbols.lds",
        "//tensorflow/lite:tflite_version_script.lds",
    ],
)

새로 추가된 대상은 다음과 같이 빌드할 수 있습니다.

bazel build -c opt  --cxxopt=--std=c++17 \
  //tmp:tensorflowlite

Android의 경우 (64비트의 경우 android_armandroid_arm64로 대체):

bazel build -c opt --cxxopt=--std=c++17 --config=android_arm \
  //tmp:tensorflowlite

TF 작업 선택이 포함된 모델의 경우 다음 공유 라이브러리도 빌드해야 합니다.

load(
    "@org_tensorflow//tensorflow/lite/delegates/flex:build_def.bzl",
    "tflite_flex_shared_library"
)

# Shared lib target for convenience, pulls in the standard set of TensorFlow
# ops and kernels. The output library name is platform dependent:
#   - Linux/Android: `libtensorflowlite_flex.so`
#   - Mac: `libtensorflowlite_flex.dylib`
#   - Windows: `libtensorflowlite_flex.dll`
tflite_flex_shared_library(
  name = "tensorflowlite_flex",
  models = [
      ":model_one.tflite",
      ":model_two.tflite",
  ],
)

새로 추가된 대상은 다음과 같이 빌드할 수 있습니다.

bazel build -c opt --cxxopt='--std=c++17' \
      --config=monolithic \
      --host_crosstool_top=@bazel_tools//tools/cpp:toolchain \
      //tmp:tensorflowlite_flex

Android의 경우 (64비트의 경우 android_armandroid_arm64로 대체):

bazel build -c opt --cxxopt='--std=c++17' \
      --config=android_arm \
      --config=monolithic \
      --host_crosstool_top=@bazel_tools//tools/cpp:toolchain \
      //tmp:tensorflowlite_flex

Docker를 사용하여 선택적으로 TensorFlow Lite 빌드

이 섹션에서는 로컬 머신에 Docker를 설치하고 여기에서 TensorFlow Lite Dockerfile을 다운로드했다고 가정합니다.

위의 Dockerfile을 다운로드한 후 다음을 실행하여 Docker 이미지를 빌드할 수 있습니다.

docker build . -t tflite-builder -f tflite-android.Dockerfile

Android 프로젝트용 AAR 파일 빌드

다음을 실행하여 Docker로 빌드하기 위한 스크립트를 다운로드합니다.

curl -o build_aar_with_docker.sh \
  https://raw.githubusercontent.com/tensorflow/tensorflow/master/tensorflow/lite/tools/build_aar_with_docker.sh &&
chmod +x build_aar_with_docker.sh

그런 다음, 다음과 같이 모델 파일 경로를 제공하여 커스텀 TensorFlow Lite AAR을 빌드할 수 있습니다.

sh build_aar_with_docker.sh \
  --input_models=/a/b/model_one.tflite,/c/d/model_two.tflite \
  --target_archs=x86,x86_64,arm64-v8a,armeabi-v7a \
  --checkpoint=master \
  [--cache_dir=<path to cache directory>]

checkpoint 플래그는 라이브러리를 빌드하기 전에 체크아웃할 TensorFlow 저장소의 커밋, 브랜치 또는 태그이며, 기본적으로 최신 출시 브랜치입니다. 위 명령어는 TensorFlow Lite 기본 제공 및 맞춤 작업을 위한 AAR 파일 tensorflow-lite.aar을 생성하고 선택적으로 현재 디렉터리의 일부 TensorFlow 작업을 위한 AAR 파일 tensorflow-lite-select-tf-ops.aar을 생성합니다.

--cache_dir은 캐시 디렉터리를 지정합니다. 제공되지 않으면 스크립트는 캐싱을 위해 현재 작업 디렉터리 아래에 bazel-build-cache라는 디렉터리를 만듭니다.

프로젝트에 AAR 파일 추가

AAR을 프로젝트로 직접 가져오거나 맞춤 AAR을 로컬 Maven 저장소에 게시하여 AAR 파일을 추가합니다. AAR 파일을 생성한 경우 tensorflow-lite-select-tf-ops.aar의 AAR 파일도 추가해야 합니다.

iOS용 선택적 빌드

로컬 빌드 섹션을 참고하여 빌드 환경을 설정하고 TensorFlow 작업공간을 구성한 다음 가이드에 따라 iOS용 선택적 빌드 스크립트를 사용하세요.