Reduzir o tamanho do binário do TensorFlow Lite

Visão geral

Ao implantar modelos para aplicativos de machine learning (ODML) no dispositivo, é importante ter em mente a memória limitada disponível em dispositivos móveis. Os tamanhos dos binários do modelo estão estreitamente correlacionados ao número de operações usadas nele. O TensorFlow Lite permite reduzir os tamanhos binários do modelo usando builds seletivos. As versões seletivas ignoram as operações não utilizadas no conjunto de modelos e produzem uma biblioteca compacta apenas com o ambiente de execução e os kernels de operação necessários para que o modelo seja executado no dispositivo móvel.

A compilação seletiva se aplica às três bibliotecas de operações a seguir.

  1. Biblioteca de operações integrada do TensorFlow Lite
  2. Operações personalizadas do TensorFlow Lite
  3. Selecionar a biblioteca de operações do TensorFlow

A tabela abaixo demonstra o impacto dos builds seletivos para alguns casos de uso comuns:

Nome do modelo Domínio Arquitetura de destino Tamanhos dos arquivos AAR
Mobilenet_1.0_224(float) Classificação de imagens armeabi-v7a tensorflow-lite.aar (296.635 bytes)
arm64-v8a tensorflow-lite.aar (382.892 bytes)
ESPECIFICAÇÃO Extração do tom de som armeabi-v7a tensorflow-lite.aar (375.813 bytes)
tensorflow-lite-select-tf-ops.aar (1.676.380 bytes)
arm64-v8a tensorflow-lite.aar (421.826 bytes)
tensorflow-lite-select-tf-ops.aar (2.298.630 bytes)
i3d-kinetics-400 (link em inglês) Classificação de vídeo armeabi-v7a tensorflow-lite.aar (240.085 bytes)
tensorflow-lite-select-tf-ops.aar (1.708.597 bytes)
arm64-v8a tensorflow-lite.aar (273.713 bytes)
tensorflow-lite-select-tf-ops.aar (2.339.697 bytes)

Crie seletivamente o TensorFlow Lite com o Bazel

Esta seção pressupõe que você fez o download dos códigos-fonte do TensorFlow e configurou o ambiente de desenvolvimento local para o Bazel.

Criar arquivos AAR para projetos Android

É possível criar os AARs personalizados do TensorFlow Lite fornecendo os caminhos de arquivo do modelo conforme mostrado a seguir.

sh tensorflow/lite/tools/build_aar.sh \
  --input_models=/a/b/model_one.tflite,/c/d/model_two.tflite \
  --target_archs=x86,x86_64,arm64-v8a,armeabi-v7a

O comando acima gera o arquivo AAR bazel-bin/tmp/tensorflow-lite.aar para operações integradas e personalizadas do TensorFlow Lite. Como opção, também gera o arquivo aar bazel-bin/tmp/tensorflow-lite-select-tf-ops.aar se os modelos contêm operações selecionadas do TensorFlow. Observe que isso gera um AAR "gordo" com várias arquiteturas diferentes. Se você não precisar de todas elas, use o subconjunto apropriado para seu ambiente de implantação.

Criar com operações personalizadas

Se você já desenvolveu modelos do Tensorflow Lite com operações personalizadas, pode criá-los adicionando as seguintes sinalizações ao comando "build":

sh tensorflow/lite/tools/build_aar.sh \
  --input_models=/a/b/model_one.tflite,/c/d/model_two.tflite \
  --target_archs=x86,x86_64,arm64-v8a,armeabi-v7a \
  --tflite_custom_ops_srcs=/e/f/file1.cc,/g/h/file2.h \
  --tflite_custom_ops_deps=dep1,dep2

A sinalização tflite_custom_ops_srcs contém arquivos de origem das operações personalizadas, e a sinalização tflite_custom_ops_deps contém dependências para criar esses arquivos de origem. Observe que essas dependências precisam existir no repositório do TensorFlow.

Usos avançados: regras personalizadas do Bazel

Se o projeto estiver usando o Bazel e você quiser definir dependências do TFLite personalizadas para um determinado conjunto de modelos, defina as seguintes regras no repositório do projeto:

Apenas para os modelos com as operações integradas:

load(
    "@org_tensorflow//tensorflow/lite:build_def.bzl",
    "tflite_custom_android_library",
    "tflite_custom_c_library",
    "tflite_custom_cc_library",
)

# A selectively built TFLite Android library.
tflite_custom_android_library(
    name = "selectively_built_android_lib",
    models = [
        ":model_one.tflite",
        ":model_two.tflite",
    ],
)

# A selectively built TFLite C library.
tflite_custom_c_library(
    name = "selectively_built_c_lib",
    models = [
        ":model_one.tflite",
        ":model_two.tflite",
    ],
)

# A selectively built TFLite C++ library.
tflite_custom_cc_library(
    name = "selectively_built_cc_lib",
    models = [
        ":model_one.tflite",
        ":model_two.tflite",
    ],
)

Para os modelos com Select TF ops:

load(
    "@org_tensorflow//tensorflow/lite/delegates/flex:build_def.bzl",
    "tflite_flex_android_library",
    "tflite_flex_cc_library",
)

# A Select TF ops enabled selectively built TFLite Android library.
tflite_flex_android_library(
    name = "selective_built_tflite_flex_android_lib",
    models = [
        ":model_one.tflite",
        ":model_two.tflite",
    ],
)

# A Select TF ops enabled selectively built TFLite C++ library.
tflite_flex_cc_library(
    name = "selective_built_tflite_flex_cc_lib",
    models = [
        ":model_one.tflite",
        ":model_two.tflite",
    ],
)

Usos avançados: criar bibliotecas compartilhadas C/C++ personalizadas

Se você quiser criar seus próprios objetos compartilhados do TFLite C/C++ nos modelos fornecidos, siga as etapas abaixo:

Crie um arquivo BUILD temporário executando o seguinte comando no diretório raiz do código-fonte do TensorFlow:

mkdir -p tmp && touch tmp/BUILD

Como criar objetos compartilhados C personalizados

Se você quiser criar um objeto compartilhado do TFLite C personalizado, adicione o seguinte ao arquivo tmp/BUILD:

load(
    "//tensorflow/lite:build_def.bzl",
    "tflite_custom_c_library",
    "tflite_cc_shared_object",
)

tflite_custom_c_library(
    name = "selectively_built_c_lib",
    models = [
        ":model_one.tflite",
        ":model_two.tflite",
    ],
)

# Generates a platform-specific shared library containing the TensorFlow Lite C
# API implementation as define in `c_api.h`. The exact output library name
# is platform dependent:
#   - Linux/Android: `libtensorflowlite_c.so`
#   - Mac: `libtensorflowlite_c.dylib`
#   - Windows: `tensorflowlite_c.dll`
tflite_cc_shared_object(
    name = "tensorflowlite_c",
    linkopts = select({
        "//tensorflow:ios": [
            "-Wl,-exported_symbols_list,$(location //tensorflow/lite/c:exported_symbols.lds)",
        ],
        "//tensorflow:macos": [
            "-Wl,-exported_symbols_list,$(location //tensorflow/lite/c:exported_symbols.lds)",
        ],
        "//tensorflow:windows": [],
        "//conditions:default": [
            "-z defs",
            "-Wl,--version-script,$(location //tensorflow/lite/c:version_script.lds)",
        ],
    }),
    per_os_targets = True,
    deps = [
        ":selectively_built_c_lib",
        "//tensorflow/lite/c:exported_symbols.lds",
        "//tensorflow/lite/c:version_script.lds",
    ],
)

O destino recém-adicionado pode ser criado da seguinte maneira:

bazel build -c opt --cxxopt=--std=c++17 \
  //tmp:tensorflowlite_c

e para Android (substitua android_arm por android_arm64 para 64 bits):

bazel build -c opt --cxxopt=--std=c++17 --config=android_arm \
  //tmp:tensorflowlite_c

Como criar objetos compartilhados C++ personalizados

Se você quiser criar um objeto compartilhado do TFLite C++ personalizado, adicione o seguinte ao arquivo tmp/BUILD:

load(
    "//tensorflow/lite:build_def.bzl",
    "tflite_custom_cc_library",
    "tflite_cc_shared_object",
)

tflite_custom_cc_library(
    name = "selectively_built_cc_lib",
    models = [
        ":model_one.tflite",
        ":model_two.tflite",
    ],
)

# Shared lib target for convenience, pulls in the core runtime and builtin ops.
# Note: This target is not yet finalized, and the exact set of exported (C/C++)
# APIs is subject to change. The output library name is platform dependent:
#   - Linux/Android: `libtensorflowlite.so`
#   - Mac: `libtensorflowlite.dylib`
#   - Windows: `tensorflowlite.dll`
tflite_cc_shared_object(
    name = "tensorflowlite",
    # Until we have more granular symbol export for the C++ API on Windows,
    # export all symbols.
    features = ["windows_export_all_symbols"],
    linkopts = select({
        "//tensorflow:macos": [
            "-Wl,-exported_symbols_list,$(location //tensorflow/lite:tflite_exported_symbols.lds)",
        ],
        "//tensorflow:windows": [],
        "//conditions:default": [
            "-Wl,-z,defs",
            "-Wl,--version-script,$(location //tensorflow/lite:tflite_version_script.lds)",
        ],
    }),
    per_os_targets = True,
    deps = [
        ":selectively_built_cc_lib",
        "//tensorflow/lite:tflite_exported_symbols.lds",
        "//tensorflow/lite:tflite_version_script.lds",
    ],
)

O destino recém-adicionado pode ser criado da seguinte maneira:

bazel build -c opt  --cxxopt=--std=c++17 \
  //tmp:tensorflowlite

e para Android (substitua android_arm por android_arm64 para 64 bits):

bazel build -c opt --cxxopt=--std=c++17 --config=android_arm \
  //tmp:tensorflowlite

Para os modelos com as operações Select TF, você também precisa criar a seguinte biblioteca compartilhada:

load(
    "@org_tensorflow//tensorflow/lite/delegates/flex:build_def.bzl",
    "tflite_flex_shared_library"
)

# Shared lib target for convenience, pulls in the standard set of TensorFlow
# ops and kernels. The output library name is platform dependent:
#   - Linux/Android: `libtensorflowlite_flex.so`
#   - Mac: `libtensorflowlite_flex.dylib`
#   - Windows: `libtensorflowlite_flex.dll`
tflite_flex_shared_library(
  name = "tensorflowlite_flex",
  models = [
      ":model_one.tflite",
      ":model_two.tflite",
  ],
)

O destino recém-adicionado pode ser criado da seguinte maneira:

bazel build -c opt --cxxopt='--std=c++17' \
      --config=monolithic \
      --host_crosstool_top=@bazel_tools//tools/cpp:toolchain \
      //tmp:tensorflowlite_flex

e para Android (substitua android_arm por android_arm64 para 64 bits):

bazel build -c opt --cxxopt='--std=c++17' \
      --config=android_arm \
      --config=monolithic \
      --host_crosstool_top=@bazel_tools//tools/cpp:toolchain \
      //tmp:tensorflowlite_flex

Crie seletivamente o TensorFlow Lite com o Docker

Esta seção pressupõe que você instalou o Docker na sua máquina local e fez o download do Dockerfile do TensorFlow Lite aqui.

Depois de fazer o download do Dockerfile acima, crie a imagem Docker executando:

docker build . -t tflite-builder -f tflite-android.Dockerfile

Criar arquivos AAR para projetos Android

Faça o download do script para criar com o Docker executando:

curl -o build_aar_with_docker.sh \
  https://raw.githubusercontent.com/tensorflow/tensorflow/master/tensorflow/lite/tools/build_aar_with_docker.sh &&
chmod +x build_aar_with_docker.sh

Em seguida, você pode criar o AAR do TensorFlow Lite personalizado fornecendo os caminhos para o arquivo do modelo conforme mostrado a seguir.

sh build_aar_with_docker.sh \
  --input_models=/a/b/model_one.tflite,/c/d/model_two.tflite \
  --target_archs=x86,x86_64,arm64-v8a,armeabi-v7a \
  --checkpoint=master \
  [--cache_dir=<path to cache directory>]

A sinalização checkpoint é uma confirmação, uma ramificação ou uma tag do repositório do TensorFlow que você quer verificar antes de criar as bibliotecas. Por padrão, é a ramificação da versão mais recente. O comando acima gera o arquivo AAR tensorflow-lite.aar para operações integradas e personalizadas do TensorFlow Lite e, opcionalmente, o arquivo AAR tensorflow-lite-select-tf-ops.aar para selecionar operações do TensorFlow no diretório atual.

--cache_dir especifica o diretório do cache. Se não for fornecido, o script criará um diretório chamado bazel-build-cache no diretório de trabalho atual para armazenamento em cache.

Adicionar arquivos AAR ao projeto

Adicione arquivos AAR importando o AAR diretamente para o projeto ou publicando o AAR personalizado no repositório Maven local. Observe que você também precisa adicionar os arquivos AAR para tensorflow-lite-select-tf-ops.aar se gerá-lo.

Build seletiva para iOS

Consulte a seção Como criar localmente para configurar o ambiente de build e o espaço de trabalho do TensorFlow. Em seguida, siga o guia para usar o script de build seletivo para iOS.