Conheça o LiteRT: o ambiente de execução de alto desempenho do Google para IA no dispositivo, antes conhecido como TensorFlow Lite.

Esta página foi traduzida pela API Cloud Translation.

Compilação cruzada do LiteRT com o CMake

Esta página descreve como criar a biblioteca LiteRT para vários tipos de arquivo ARM dispositivos.

As instruções a seguir foram testadas em um PC Ubuntu 16.04.3 de 64 bits (AMD64) , imagem Docker de desenvolvimento do TensorFlow tensorflow/tensorflow:devel.

Pré-requisitos

Você precisa ter o CMake instalado e fazer o download do código-fonte do TensorFlow. Verifique Criar LiteRT com o CMake para mais detalhes.

Verifique o ambiente de destino

Os exemplos a seguir são testados no SO Raspberry Pi, o Ubuntu Server 20.04 LTS e Mendel Linux 4.0. Dependendo da versão do glibc de destino e da CPU recursos, talvez seja necessário usar uma versão diferente do conjunto de ferramentas e criar parâmetros.

Verificar a versão do glibc

ldd --version

ldd (Debian GLIBC 2.28-10) 2.28
Copyright (C) 2018 Free Software Foundation, Inc.
This is free software; see the source for copying conditions.  There is NO
warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
Written by Roland McGrath and Ulrich Drepper.

Verificar a compatibilidade com ABI

Se o destino for ARM de 32 bits, há duas ABI disponíveis, dependendo do VFP disponibilidade. armhf e armel. Este documento mostra um armhf exemplo, é necessário usar diferentes conjuntos de ferramentas para destinos armel.

Verificar a capacidade da CPU

Para ARMv7, você deve saber a versão do VFP compatível com o destino e a disponibilidade do NEON.

cat /proc/cpuinfo

processor   : 0
model name  : ARMv7 Processor rev 3 (v7l)
BogoMIPS    : 108.00
Features    : half thumb fastmult vfp edsp neon vfpv3 tls vfpv4 idiva idivt vfpd32 lpae evtstrm crc32
CPU implementer : 0x41
CPU architecture: 7
CPU variant : 0x0
CPU part    : 0xd08
CPU revision    : 3

Criar para AArch64 (ARM64)

Esta instrução mostra como criar um binário AArch64 compatível com Coral Mendel Linux 4.0, Raspberry Pi (com Ubuntu Server 20.04.01 LTS de 64 bits instalado).

Fazer o download do conjunto de ferramentas

Esses comandos instalam o conjunto de ferramentas gcc-arm-8.3-2019.03-x86_64-aarch64-linux-gnu. em ${HOME}/Datasets.

curl -LO https://storage.googleapis.com/mirror.tensorflow.org/developer.arm.com/media/Files/downloads/gnu-a/8.3-2019.03/binrel/gcc-arm-8.3-2019.03-x86_64-aarch64-linux-gnu.tar.xz
mkdir -p ${HOME}/toolchains
tar xvf gcc-arm-8.3-2019.03-x86_64-aarch64-linux-gnu.tar.xz -C ${HOME}/toolchains

Executar o CMake

ARMCC_PREFIX=${HOME}/toolchains/gcc-arm-8.3-2019.03-x86_64-aarch64-linux-gnu/bin/aarch64-linux-gnu-
ARMCC_FLAGS="-funsafe-math-optimizations"
cmake -DCMAKE_C_COMPILER=${ARMCC_PREFIX}gcc \
  -DCMAKE_CXX_COMPILER=${ARMCC_PREFIX}g++ \
  -DCMAKE_C_FLAGS="${ARMCC_FLAGS}" \
  -DCMAKE_CXX_FLAGS="${ARMCC_FLAGS}" \
  -DCMAKE_VERBOSE_MAKEFILE:BOOL=ON \
  -DCMAKE_SYSTEM_NAME=Linux \
  -DCMAKE_SYSTEM_PROCESSOR=aarch64 \
  ../tensorflow/lite/

Build para ARMv7 NEON ativado

Esta instrução mostra como criar o ARMv7 com o binário ativado para VFPv4 e NEON que é compatível com o Raspberry Pi 3 e 4.

Fazer o download do conjunto de ferramentas

Esses comandos instalam gcc-arm-8.3-2019.03-x86_64-arm-linux-gnueabihf conjunto de ferramentas em ${HOME}/Datasets.

curl -LO https://storage.googleapis.com/mirror.tensorflow.org/developer.arm.com/media/Files/downloads/gnu-a/8.3-2019.03/binrel/gcc-arm-8.3-2019.03-x86_64-arm-linux-gnueabihf.tar.xz
mkdir -p ${HOME}/toolchains
tar xvf gcc-arm-8.3-2019.03-x86_64-arm-linux-gnueabihf.tar.xz -C ${HOME}/toolchains

Executar o CMake

ARMCC_FLAGS="-march=armv7-a -mfpu=neon-vfpv4 -funsafe-math-optimizations -mfp16-format=ieee"
ARMCC_PREFIX=${HOME}/toolchains/gcc-arm-8.3-2019.03-x86_64-arm-linux-gnueabihf/bin/arm-linux-gnueabihf-
cmake -DCMAKE_C_COMPILER=${ARMCC_PREFIX}gcc \
  -DCMAKE_CXX_COMPILER=${ARMCC_PREFIX}g++ \
  -DCMAKE_C_FLAGS="${ARMCC_FLAGS}" \
  -DCMAKE_CXX_FLAGS="${ARMCC_FLAGS}" \
  -DCMAKE_VERBOSE_MAKEFILE:BOOL=ON \
  -DCMAKE_SYSTEM_NAME=Linux \
  -DCMAKE_SYSTEM_PROCESSOR=armv7 \
  ../tensorflow/lite/

Criar para Raspberry Pi Zero (ARMv6)

Esta instrução mostra como criar um binário ARMv6 compatível com o Raspberry Pi Zero.

Fazer o download do conjunto de ferramentas

Esses comandos instalam gcc-arm-8.3-2019.03-x86_64-arm-linux-gnueabihf conjunto de ferramentas em ${HOME}/Datasets.

curl -LO https://storage.googleapis.com/mirror.tensorflow.org/developer.arm.com/media/Files/downloads/gnu-a/8.3-2019.03/binrel/gcc-arm-8.3-2019.03-x86_64-arm-linux-gnueabihf.tar.xz
mkdir -p ${HOME}/toolchains
tar xvf gcc-arm-8.3-2019.03-x86_64-arm-linux-gnueabihf.tar.xz -C ${HOME}/toolchains

Executar o CMake

ARMCC_FLAGS="-march=armv6 -mfpu=vfp -mfloat-abi=hard -funsafe-math-optimizations"
ARMCC_PREFIX=${HOME}/toolchains/gcc-arm-8.3-2019.03-x86_64-arm-linux-gnueabihf/bin/arm-linux-gnueabihf-
cmake -DCMAKE_C_COMPILER=${ARMCC_PREFIX}gcc \
  -DCMAKE_CXX_COMPILER=${ARMCC_PREFIX}g++ \
  -DCMAKE_C_FLAGS="${ARMCC_FLAGS}" \
  -DCMAKE_CXX_FLAGS="${ARMCC_FLAGS}" \
  -DCMAKE_VERBOSE_MAKEFILE:BOOL=ON \
  -DCMAKE_SYSTEM_NAME=Linux \
  -DCMAKE_SYSTEM_PROCESSOR=armv6 \
  -DTFLITE_ENABLE_XNNPACK=OFF \
  ../tensorflow/lite/