Na tej stronie dowiesz się, jak utworzyć bibliotekę LiteRT dla różnych architektur ARM urządzenia.
Poniższe instrukcje zostały przetestowane w systemie Ubuntu 16.04.3 64-bitowego komputera (AMD64) , obraz programistycznego Dockera TensorFlow tensorflow/tensorflow:devel.
Wymagania wstępne
Musisz mieć zainstalowany i pobrany kod źródłowy TensorFlow w CMake. Sprawdź Tworzenie LiteRT przy użyciu CMake .
Sprawdzanie środowiska docelowego
Poniższe przykłady zostały przetestowane w systemie Raspberry Pi i Ubuntu Server 20.04 LTS i Mendel Linux 4.0. W zależności od docelowej wersji glibc i procesora funkcji, może być konieczne użycie innej wersji łańcucha narzędzi i kompilacji .
Sprawdzam wersję glibc
ldd --version
ldd (Debian GLIBC 2.28-10) 2.28 Copyright (C) 2018 Free Software Foundation, Inc. This is free software; see the source for copying conditions. There is NO warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. Written by Roland McGrath and Ulrich Drepper.
Sprawdzanie zgodności z interfejsem ABI
Jeśli wartością docelową jest 32-bitowa architektura ARM, dostępne są 2 interfejsy ABI w zależności od VFP dostępność. armhf oraz armel Ten dokument przedstawia armhf Na przykład dla celów Armel trzeba użyć innego łańcucha narzędzi.
Sprawdzam możliwości procesora
W przypadku procesora ARMv7 musisz znać obsługiwaną wersję VFP w środowisku docelowym i dostępność NEON.
cat /proc/cpuinfo
processor : 0 model name : ARMv7 Processor rev 3 (v7l) BogoMIPS : 108.00 Features : half thumb fastmult vfp edsp neon vfpv3 tls vfpv4 idiva idivt vfpd32 lpae evtstrm crc32 CPU implementer : 0x41 CPU architecture: 7 CPU variant : 0x0 CPU part : 0xd08 CPU revision : 3
Kompilacja dla AArch64 (ARM64)
Ta instrukcja pokazuje, jak utworzyć plik binarny AArch64 zgodny z Coral Mendel Linux 4.0, Raspberry Pi (z Ubuntu Server 20.04.01 LTS 64-bitowy zainstalowano).
Pobierz łańcuch narzędzi
Te polecenia instalują łańcuch narzędzi gcc-arm-8.3-2019.03-x86_64-aarch64-linux-gnu
w sekcji ${HOME}/łańcuchy narzędzi.
curl -LO https://storage.googleapis.com/mirror.tensorflow.org/developer.arm.com/media/Files/downloads/gnu-a/8.3-2019.03/binrel/gcc-arm-8.3-2019.03-x86_64-aarch64-linux-gnu.tar.xz
mkdir -p ${HOME}/toolchains
tar xvf gcc-arm-8.3-2019.03-x86_64-aarch64-linux-gnu.tar.xz -C ${HOME}/toolchains
Uruchom CMake
ARMCC_PREFIX=${HOME}/toolchains/gcc-arm-8.3-2019.03-x86_64-aarch64-linux-gnu/bin/aarch64-linux-gnu-
ARMCC_FLAGS="-funsafe-math-optimizations"
cmake -DCMAKE_C_COMPILER=${ARMCC_PREFIX}gcc \
-DCMAKE_CXX_COMPILER=${ARMCC_PREFIX}g++ \
-DCMAKE_C_FLAGS="${ARMCC_FLAGS}" \
-DCMAKE_CXX_FLAGS="${ARMCC_FLAGS}" \
-DCMAKE_VERBOSE_MAKEFILE:BOOL=ON \
-DCMAKE_SYSTEM_NAME=Linux \
-DCMAKE_SYSTEM_PROCESSOR=aarch64 \
../tensorflow/lite/
Włączono kompilację dla ARMv7 NEON
Ta instrukcja pokazuje, jak utworzyć ARMv7 z plikiem binarnym z włączoną obsługą VFPv4 i NEON która jest zgodna z Raspberry Pi 3 i 4.
Pobierz łańcuch narzędzi
Te polecenia instalują aplikację gcc-arm-8.3-2019.03-x86_64-arm-linux-gnueabihf
w następujący sposób: ${HOME}/łańcuchy narzędzi.
curl -LO https://storage.googleapis.com/mirror.tensorflow.org/developer.arm.com/media/Files/downloads/gnu-a/8.3-2019.03/binrel/gcc-arm-8.3-2019.03-x86_64-arm-linux-gnueabihf.tar.xz
mkdir -p ${HOME}/toolchains
tar xvf gcc-arm-8.3-2019.03-x86_64-arm-linux-gnueabihf.tar.xz -C ${HOME}/toolchains
Uruchom CMake
ARMCC_FLAGS="-march=armv7-a -mfpu=neon-vfpv4 -funsafe-math-optimizations -mfp16-format=ieee"
ARMCC_PREFIX=${HOME}/toolchains/gcc-arm-8.3-2019.03-x86_64-arm-linux-gnueabihf/bin/arm-linux-gnueabihf-
cmake -DCMAKE_C_COMPILER=${ARMCC_PREFIX}gcc \
-DCMAKE_CXX_COMPILER=${ARMCC_PREFIX}g++ \
-DCMAKE_C_FLAGS="${ARMCC_FLAGS}" \
-DCMAKE_CXX_FLAGS="${ARMCC_FLAGS}" \
-DCMAKE_VERBOSE_MAKEFILE:BOOL=ON \
-DCMAKE_SYSTEM_NAME=Linux \
-DCMAKE_SYSTEM_PROCESSOR=armv7 \
../tensorflow/lite/
Kompilacja dla Raspberry Pi Zero (ARMv6)
Ta instrukcja pokazuje, jak utworzyć plik binarny ARMv6 zgodny z Malinowy Pi Zero.
Pobierz łańcuch narzędzi
Te polecenia instalują aplikację gcc-arm-8.3-2019.03-x86_64-arm-linux-gnueabihf
w następujący sposób: ${HOME}/łańcuchy narzędzi.
curl -LO https://storage.googleapis.com/mirror.tensorflow.org/developer.arm.com/media/Files/downloads/gnu-a/8.3-2019.03/binrel/gcc-arm-8.3-2019.03-x86_64-arm-linux-gnueabihf.tar.xz
mkdir -p ${HOME}/toolchains
tar xvf gcc-arm-8.3-2019.03-x86_64-arm-linux-gnueabihf.tar.xz -C ${HOME}/toolchains
Uruchom CMake
ARMCC_FLAGS="-march=armv6 -mfpu=vfp -mfloat-abi=hard -funsafe-math-optimizations"
ARMCC_PREFIX=${HOME}/toolchains/gcc-arm-8.3-2019.03-x86_64-arm-linux-gnueabihf/bin/arm-linux-gnueabihf-
cmake -DCMAKE_C_COMPILER=${ARMCC_PREFIX}gcc \
-DCMAKE_CXX_COMPILER=${ARMCC_PREFIX}g++ \
-DCMAKE_C_FLAGS="${ARMCC_FLAGS}" \
-DCMAKE_CXX_FLAGS="${ARMCC_FLAGS}" \
-DCMAKE_VERBOSE_MAKEFILE:BOOL=ON \
-DCMAKE_SYSTEM_NAME=Linux \
-DCMAKE_SYSTEM_PROCESSOR=armv6 \
-DTFLITE_ENABLE_XNNPACK=OFF \
../tensorflow/lite/