Разработчики мобильных приложений обычно взаимодействуют с типизированными объектами, такими как растровые изображения или примитивы, например, целые числа. Однако API интерпретатора LiteRT, запускающий модель машинного обучения на устройстве, использует тензоры в форме ByteBuffer, которые могут быть сложны в отладке и работе с ними. Библиотека поддержки LiteRT для Android предназначена для обработки входных и выходных данных моделей LiteRT и упрощает использование интерпретатора LiteRT.
Начиная
Импорт зависимостей Gradle и других настроек
Скопируйте файл модели .tflite в каталог ресурсов модуля Android, где он будет запущен. Укажите, что файл не нужно сжимать, и добавьте библиотеку LiteRT в файл build.gradle модуля:
android {
// Other settings
// Specify tflite file should not be compressed for the app apk
aaptOptions {
noCompress "tflite"
}
}
dependencies {
// Other dependencies
// Import tflite dependencies
implementation 'org.tensorflow:tensorflow-lite:0.0.0-nightly-SNAPSHOT'
// The GPU delegate library is optional. Depend on it as needed.
implementation 'com.google.ai.edge.litert:litert-gpu:0.0.0-nightly-SNAPSHOT'
implementation 'com.google.ai.edge.litert:litert-support:0.0.0-nightly-SNAPSHOT'
}
Изучите AAR-файл библиотеки поддержки LiteRT, размещенный на MavenCentral, для получения информации о различных версиях библиотеки поддержки.
Базовая обработка и преобразование изображений
Библиотека поддержки LiteRT содержит набор базовых методов обработки изображений, таких как кадрирование и изменение размера. Чтобы использовать её, создайте ImagePreprocessor и добавьте необходимые операции. Чтобы преобразовать изображение в тензорный формат, требуемый интерпретатором LiteRT, создайте TensorImage , который будет использоваться в качестве входных данных:
import org.tensorflow.lite.DataType;
import org.tensorflow.lite.support.image.ImageProcessor;
import org.tensorflow.lite.support.image.TensorImage;
import org.tensorflow.lite.support.image.ops.ResizeOp;
// Initialization code
// Create an ImageProcessor with all ops required. For more ops, please
// refer to the ImageProcessor Architecture section in this README.
ImageProcessor imageProcessor =
new ImageProcessor.Builder()
.add(new ResizeOp(224, 224, ResizeOp.ResizeMethod.BILINEAR))
.build();
// Create a TensorImage object. This creates the tensor of the corresponding
// tensor type (uint8 in this case) that the LiteRT interpreter needs.
TensorImage tensorImage = new TensorImage(DataType.UINT8);
// Analysis code for every frame
// Preprocess the image
tensorImage.load(bitmap);
tensorImage = imageProcessor.process(tensorImage);
DataType тензора, как и другая информация модели, можно прочитать с помощью библиотеки извлечения метаданных .
Базовая обработка аудиоданных
Библиотека поддержки LiteRT также определяет класс TensorAudio , обёртывающий некоторые базовые методы обработки аудиоданных. Он в основном используется вместе с AudioRecord и записывает аудиосэмплы в кольцевой буфер.
import android.media.AudioRecord;
import org.tensorflow.lite.support.audio.TensorAudio;
// Create an `AudioRecord` instance.
AudioRecord record = AudioRecord(...)
// Create a `TensorAudio` object from Android AudioFormat.
TensorAudio tensorAudio = new TensorAudio(record.getFormat(), size)
// Load all audio samples available in the AudioRecord without blocking.
tensorAudio.load(record)
// Get the `TensorBuffer` for inference.
TensorBuffer buffer = tensorAudio.getTensorBuffer()
Создать выходные объекты и запустить модель
Перед запуском модели нам необходимо создать объекты-контейнеры, в которых будет храниться результат:
import org.tensorflow.lite.DataType;
import org.tensorflow.lite.support.tensorbuffer.TensorBuffer;
// Create a container for the result and specify that this is a quantized model.
// Hence, the 'DataType' is defined as UINT8 (8-bit unsigned integer)
TensorBuffer probabilityBuffer =
TensorBuffer.createFixedSize(new int[]{1, 1001}, DataType.UINT8);
Загрузка модели и запуск вывода:
import java.nio.MappedByteBuffer;
import org.tensorflow.lite.InterpreterFactory;
import org.tensorflow.lite.InterpreterApi;
// Initialise the model
try{
MappedByteBuffer tfliteModel
= FileUtil.loadMappedFile(activity,
"mobilenet_v1_1.0_224_quant.tflite");
InterpreterApi tflite = new InterpreterFactory().create(
tfliteModel, new InterpreterApi.Options());
} catch (IOException e){
Log.e("tfliteSupport", "Error reading model", e);
}
// Running inference
if(null != tflite) {
tflite.run(tImage.getBuffer(), probabilityBuffer.getBuffer());
}
Доступ к результату
Разработчики могут получить доступ к выходным данным напрямую через probabilityBuffer.getFloatArray() . Если модель выдаёт квантованный результат, не забудьте преобразовать его. Для квантованной модели MobileNet разработчику необходимо разделить каждое выходное значение на 255, чтобы получить вероятность в диапазоне от 0 (наименее вероятно) до 1 (наиболее вероятно) для каждой категории.
Необязательно: сопоставление результатов с метками
Разработчики также могут опционально сопоставлять результаты с метками. Сначала скопируйте текстовый файл с метками в каталог ресурсов модуля. Затем загрузите файл меток, используя следующий код:
import org.tensorflow.lite.support.common.FileUtil;
final String ASSOCIATED_AXIS_LABELS = "labels.txt";
List<String> associatedAxisLabels = null;
try {
associatedAxisLabels = FileUtil.loadLabels(this, ASSOCIATED_AXIS_LABELS);
} catch (IOException e) {
Log.e("tfliteSupport", "Error reading label file", e);
}
В следующем фрагменте показано, как связать вероятности с метками категорий:
import java.util.Map;
import org.tensorflow.lite.support.common.TensorProcessor;
import org.tensorflow.lite.support.common.ops.NormalizeOp;
import org.tensorflow.lite.support.label.TensorLabel;
// Post-processor which dequantize the result
TensorProcessor probabilityProcessor =
new TensorProcessor.Builder().add(new NormalizeOp(0, 255)).build();
if (null != associatedAxisLabels) {
// Map of labels and their corresponding probability
TensorLabel labels = new TensorLabel(associatedAxisLabels,
probabilityProcessor.process(probabilityBuffer));
// Create a map to access the result based on label
Map<String, Float> floatMap = labels.getMapWithFloatValue();
}
Текущее покрытие вариантов использования
Текущая версия библиотеки поддержки LiteRT охватывает:
- общие типы данных (float, uint8, изображения, аудио и массив этих объектов) в качестве входов и выходов моделей tflite.
- базовые операции с изображениями (обрезка изображения, изменение размера и поворот).
- нормализация и квантование
- файлы утилит
В будущих версиях будет улучшена поддержка текстовых приложений.
Архитектура ImageProcessor
Архитектура ImageProcessor позволила заранее определить операции обработки изображений и оптимизировать их в процессе сборки. В настоящее время ImageProcessor поддерживает три основные операции предварительной обработки, описанные в трёх комментариях к фрагменту кода ниже:
import org.tensorflow.lite.support.common.ops.NormalizeOp;
import org.tensorflow.lite.support.common.ops.QuantizeOp;
import org.tensorflow.lite.support.image.ops.ResizeOp;
import org.tensorflow.lite.support.image.ops.ResizeWithCropOrPadOp;
import org.tensorflow.lite.support.image.ops.Rot90Op;
int width = bitmap.getWidth();
int height = bitmap.getHeight();
int size = height > width ? width : height;
ImageProcessor imageProcessor =
new ImageProcessor.Builder()
// Center crop the image to the largest square possible
.add(new ResizeWithCropOrPadOp(size, size))
// Resize using Bilinear or Nearest neighbour
.add(new ResizeOp(224, 224, ResizeOp.ResizeMethod.BILINEAR));
// Rotation counter-clockwise in 90 degree increments
.add(new Rot90Op(rotateDegrees / 90))
.add(new NormalizeOp(127.5, 127.5))
.add(new QuantizeOp(128.0, 1/128.0))
.build();
Более подробную информацию о нормализации и квантовании можно найти здесь .
Конечная цель библиотеки поддержки — обеспечить поддержку всех преобразований tf.image . Это означает, что преобразование будет таким же, как в TensorFlow, а реализация не будет зависеть от операционной системы.
Разработчики также могут создавать собственные процессоры. В таких случаях важно обеспечить согласованность с процессом обучения, то есть одинаковая предварительная обработка должна применяться как к обучению, так и к выводу для повышения воспроизводимости.
Квантование
При инициализации объектов ввода или вывода, таких как TensorImage или TensorBuffer необходимо указать их типы как DataType.UINT8 или DataType.FLOAT32 .
TensorImage tensorImage = new TensorImage(DataType.UINT8);
TensorBuffer probabilityBuffer =
TensorBuffer.createFixedSize(new int[]{1, 1001}, DataType.UINT8);
TensorProcessor можно использовать для квантования входных тензоров или деквантования выходных тензоров. Например, при обработке квантованного выходного TensorBuffer разработчик может использовать DequantizeOp для деквантования результата в вероятность с плавающей точкой в диапазоне от 0 до 1:
import org.tensorflow.lite.support.common.TensorProcessor;
// Post-processor which dequantize the result
TensorProcessor probabilityProcessor =
new TensorProcessor.Builder().add(new DequantizeOp(0, 1/255.0)).build();
TensorBuffer dequantizedBuffer = probabilityProcessor.process(probabilityBuffer);
Параметры квантования тензора можно прочитать с помощью библиотеки извлечения метаданных .