Apresentação do Google AI Edge Portal: compare a IA Edge em escala. Inscrição para solicitar acesso durante a visualização particular.

Processar dados de entrada e saída com a Biblioteca de Suporte LiteRT

Os desenvolvedores de aplicativos móveis geralmente interagem com objetos tipados, como bitmaps ou primitivos, como números inteiros. No entanto, a API do interpretador LiteRT que executa o modelo de aprendizado de máquina no dispositivo usa tensores na forma de ByteBuffer, que pode ser difícil de depurar e manipular. A biblioteca de suporte do Android LiteRT foi projetada para ajudar a processar a entrada e a saída de modelos do LiteRT e facilitar o uso do intérprete do LiteRT.

Primeiros passos

Importar dependência do Gradle e outras configurações

Copie o arquivo de modelo .tflite para o diretório de recursos do módulo Android em que o modelo será executado. Especifique que o arquivo não deve ser compactado e adicione a biblioteca LiteRT ao arquivo build.gradle do módulo:

android {
    // Other settings

    // Specify tflite file should not be compressed for the app apk
    aaptOptions {
        noCompress "tflite"
    }

}

dependencies {
    // Other dependencies

    // Import tflite dependencies
    implementation 'org.tensorflow:tensorflow-lite:0.0.0-nightly-SNAPSHOT'
    // The GPU delegate library is optional. Depend on it as needed.
    implementation 'com.google.ai.edge.litert:litert-gpu:0.0.0-nightly-SNAPSHOT'
    implementation 'com.google.ai.edge.litert:litert-support:0.0.0-nightly-SNAPSHOT'
}

Confira o AAR da Biblioteca de Suporte do LiteRT hospedado no MavenCentral para diferentes versões da Biblioteca de Suporte.

Manipulação e conversão básicas de imagens

A biblioteca de suporte do LiteRT tem um conjunto de métodos básicos de manipulação de imagens, como recortar e redimensionar. Para usar, crie um ImagePreprocessor e adicione as operações necessárias. Para converter a imagem no formato de tensor exigido pelo interpretador LiteRT, crie um TensorImage para ser usado como entrada:

import org.tensorflow.lite.DataType;
import org.tensorflow.lite.support.image.ImageProcessor;
import org.tensorflow.lite.support.image.TensorImage;
import org.tensorflow.lite.support.image.ops.ResizeOp;

// Initialization code
// Create an ImageProcessor with all ops required. For more ops, please
// refer to the ImageProcessor Architecture section in this README.
ImageProcessor imageProcessor =
    new ImageProcessor.Builder()
        .add(new ResizeOp(224, 224, ResizeOp.ResizeMethod.BILINEAR))
        .build();

// Create a TensorImage object. This creates the tensor of the corresponding
// tensor type (uint8 in this case) that the LiteRT interpreter needs.
TensorImage tensorImage = new TensorImage(DataType.UINT8);

// Analysis code for every frame
// Preprocess the image
tensorImage.load(bitmap);
tensorImage = imageProcessor.process(tensorImage);

O DataType de um tensor pode ser lido pela biblioteca de extrator de metadados, além de outras informações do modelo.

Processamento básico de dados de áudio

A LiteRT Support Library também define uma classe TensorAudio que encapsula alguns métodos básicos de processamento de dados de áudio. Ele é usado principalmente com AudioRecord e captura amostras de áudio em um buffer circular.

import android.media.AudioRecord;
import org.tensorflow.lite.support.audio.TensorAudio;

// Create an `AudioRecord` instance.
AudioRecord record = AudioRecord(...)

// Create a `TensorAudio` object from Android AudioFormat.
TensorAudio tensorAudio = new TensorAudio(record.getFormat(), size)

// Load all audio samples available in the AudioRecord without blocking.
tensorAudio.load(record)

// Get the `TensorBuffer` for inference.
TensorBuffer buffer = tensorAudio.getTensorBuffer()

Criar objetos de saída e executar o modelo

Antes de executar o modelo, precisamos criar os objetos de contêiner que vão armazenar o resultado:

import org.tensorflow.lite.DataType;
import org.tensorflow.lite.support.tensorbuffer.TensorBuffer;

// Create a container for the result and specify that this is a quantized model.
// Hence, the 'DataType' is defined as UINT8 (8-bit unsigned integer)
TensorBuffer probabilityBuffer =
    TensorBuffer.createFixedSize(new int[]{1, 1001}, DataType.UINT8);

Carregue o modelo e execute a inferência:

import java.nio.MappedByteBuffer;
import org.tensorflow.lite.InterpreterFactory;
import org.tensorflow.lite.InterpreterApi;

// Initialise the model
try{
    MappedByteBuffer tfliteModel
        = FileUtil.loadMappedFile(activity,
            "mobilenet_v1_1.0_224_quant.tflite");
    InterpreterApi tflite = new InterpreterFactory().create(
        tfliteModel, new InterpreterApi.Options());
} catch (IOException e){
    Log.e("tfliteSupport", "Error reading model", e);
}

// Running inference
if(null != tflite) {
    tflite.run(tImage.getBuffer(), probabilityBuffer.getBuffer());
}

Como acessar o resultado

Os desenvolvedores podem acessar a saída diretamente usando probabilityBuffer.getFloatArray(). Se o modelo produzir uma saída quantizada, não se esqueça de converter o resultado. Para o modelo quantizado do MobileNet, o desenvolvedor precisa dividir cada valor de saída por 255 para obter a probabilidade que varia de 0 (menos provável) a 1 (mais provável) para cada categoria.

Opcional: mapear resultados para rótulos

Os desenvolvedores também podem mapear os resultados para rótulos. Primeiro, copie o arquivo de texto com rótulos para o diretório de recursos do módulo. Em seguida, carregue o arquivo de rótulos usando o seguinte código:

import org.tensorflow.lite.support.common.FileUtil;

final String ASSOCIATED_AXIS_LABELS = "labels.txt";
List<String> associatedAxisLabels = null;

try {
    associatedAxisLabels = FileUtil.loadLabels(this, ASSOCIATED_AXIS_LABELS);
} catch (IOException e) {
    Log.e("tfliteSupport", "Error reading label file", e);
}

O snippet a seguir demonstra como associar as probabilidades a rótulos de categoria:

import java.util.Map;
import org.tensorflow.lite.support.common.TensorProcessor;
import org.tensorflow.lite.support.common.ops.NormalizeOp;
import org.tensorflow.lite.support.label.TensorLabel;

// Post-processor which dequantize the result
TensorProcessor probabilityProcessor =
    new TensorProcessor.Builder().add(new NormalizeOp(0, 255)).build();

if (null != associatedAxisLabels) {
    // Map of labels and their corresponding probability
    TensorLabel labels = new TensorLabel(associatedAxisLabels,
        probabilityProcessor.process(probabilityBuffer));

    // Create a map to access the result based on label
    Map<String, Float> floatMap = labels.getMapWithFloatValue();
}

Cobertura atual dos casos de uso

A versão atual da biblioteca de suporte do LiteRT abrange:

tipos de dados comuns (float, uint8, imagens, áudio e matriz desses objetos) como entradas e saídas de modelos tflite.
operações básicas de imagem (cortar, redimensionar e girar).
normalização e quantização
utilitários de arquivo

As versões futuras vão melhorar a compatibilidade com aplicativos relacionados a texto.

Arquitetura do ImageProcessor

O design do ImageProcessor permitiu que as operações de manipulação de imagens fossem definidas antecipadamente e otimizadas durante o processo de build. O ImageProcessor atualmente oferece suporte a três operações básicas de pré-processamento, conforme descrito nos três comentários no snippet de código abaixo:

import org.tensorflow.lite.support.common.ops.NormalizeOp;
import org.tensorflow.lite.support.common.ops.QuantizeOp;
import org.tensorflow.lite.support.image.ops.ResizeOp;
import org.tensorflow.lite.support.image.ops.ResizeWithCropOrPadOp;
import org.tensorflow.lite.support.image.ops.Rot90Op;

int width = bitmap.getWidth();
int height = bitmap.getHeight();

int size = height > width ? width : height;

ImageProcessor imageProcessor =
    new ImageProcessor.Builder()
        // Center crop the image to the largest square possible
        .add(new ResizeWithCropOrPadOp(size, size))
        // Resize using Bilinear or Nearest neighbour
        .add(new ResizeOp(224, 224, ResizeOp.ResizeMethod.BILINEAR));
        // Rotation counter-clockwise in 90 degree increments
        .add(new Rot90Op(rotateDegrees / 90))
        .add(new NormalizeOp(127.5, 127.5))
        .add(new QuantizeOp(128.0, 1/128.0))
        .build();

Confira mais detalhes aqui sobre normalização e quantização.

O objetivo final da biblioteca de suporte é oferecer suporte a todas as transformações tf.image. Isso significa que a transformação será a mesma do TensorFlow, e a implementação será independente do sistema operacional.

Os desenvolvedores também podem criar processadores personalizados. É importante, nesses casos, estar alinhado com o processo de treinamento. Ou seja, o mesmo pré-processamento deve ser aplicado ao treinamento e à inferência para aumentar a capacidade de reprodução.

Quantização

Ao iniciar objetos de entrada ou saída, como TensorImage ou TensorBuffer, é necessário especificar os tipos como DataType.UINT8 ou DataType.FLOAT32.

TensorImage tensorImage = new TensorImage(DataType.UINT8);
TensorBuffer probabilityBuffer =
    TensorBuffer.createFixedSize(new int[]{1, 1001}, DataType.UINT8);

O TensorProcessor pode ser usado para quantizar tensores de entrada ou desquantizar tensores de saída. Por exemplo, ao processar uma saída quantizada TensorBuffer, o desenvolvedor pode usar DequantizeOp para desquantizar o resultado em uma probabilidade de ponto flutuante entre 0 e 1:

import org.tensorflow.lite.support.common.TensorProcessor;

// Post-processor which dequantize the result
TensorProcessor probabilityProcessor =
    new TensorProcessor.Builder().add(new DequantizeOp(0, 1/255.0)).build();
TensorBuffer dequantizedBuffer = probabilityProcessor.process(probabilityBuffer);

Os parâmetros de quantização de um tensor podem ser lidos usando a biblioteca de extrator de metadados.