Apresentação do Google AI Edge Portal: compare a IA Edge em escala. Inscrição para solicitar acesso durante a visualização particular.

LiteRT na API Google Play Services Java (e Kotlin)

Também é possível acessar o LiteRT no Google Play Services usando APIs Java, que podem ser usadas em código Java ou Kotlin, além da API nativa. Em especial, o LiteRT nos Serviços do Google Play está disponível pela API LiteRT Interpreter.

Como usar as APIs Interpreter

A API LiteRT Interpreter, fornecida pelo tempo de execução do TensorFlow, oferece uma interface de uso geral para criar e executar modelos de ML. Siga estas etapas para executar inferências com a API Interpreter usando o TensorFlow Lite no tempo de execução dos serviços do Google Play.

1. Adicionar dependências do projeto

Adicione as seguintes dependências ao código do projeto do app para acessar a API dos serviços do Google Play para LiteRT:

dependencies {
...
    // LiteRT dependencies for Google Play services
    implementation 'com.google.android.gms:play-services-tflite-java:16.1.0'
    // Optional: include LiteRT Support Library
    implementation 'com.google.android.gms:play-services-tflite-support:16.1.0'
...
}

2. Adicionar inicialização do LiteRT

Inicialize o componente LiteRT da API Google Play Services antes de usar as APIs LiteRT:

Kotlin

val initializeTask: Task<Void> by lazy { TfLite.initialize(this) }

Java

Task<Void> initializeTask = TfLite.initialize(context);

3. Criar um intérprete e definir a opção de tempo de execução

Crie um intérprete usando InterpreterApi.create() e configure-o para usar o tempo de execução do Google Play Services chamando InterpreterApi.Options.setRuntime(), como mostrado no exemplo de código a seguir:

Kotlin

import org.tensorflow.lite.InterpreterApi
import org.tensorflow.lite.InterpreterApi.Options.TfLiteRuntime
...
private lateinit var interpreter: InterpreterApi
...
initializeTask.addOnSuccessListener {
  val interpreterOption =
    InterpreterApi.Options().setRuntime(TfLiteRuntime.FROM_SYSTEM_ONLY)
  interpreter = InterpreterApi.create(
    modelBuffer,
    interpreterOption
  )}
  .addOnFailureListener { e ->
    Log.e("Interpreter", "Cannot initialize interpreter", e)
  }

Java

import org.tensorflow.lite.InterpreterApi
import org.tensorflow.lite.InterpreterApi.Options.TfLiteRuntime
...
private InterpreterApi interpreter;
...
initializeTask.addOnSuccessListener(a -> {
    interpreter = InterpreterApi.create(modelBuffer,
      new InterpreterApi.Options().setRuntime(TfLiteRuntime.FROM_SYSTEM_ONLY));
  })
  .addOnFailureListener(e -> {
    Log.e("Interpreter", String.format("Cannot initialize interpreter: %s",
          e.getMessage()));
  });

Use a implementação acima porque ela evita o bloqueio da linha de execução da interface do usuário do Android. Se você precisar gerenciar a execução de linhas de execução mais de perto, adicione uma chamada Tasks.await() à criação do interpretador:

Kotlin

import androidx.lifecycle.lifecycleScope
...
lifecycleScope.launchWhenStarted { // uses coroutine
  initializeTask.await()
}

Java

@BackgroundThread
InterpreterApi initializeInterpreter() {
    Tasks.await(initializeTask);
    return InterpreterApi.create(...);
}

4. Executar inferências

Usando o objeto interpreter que você criou, chame o método run() para gerar uma inferência.

Kotlin

interpreter.run(inputBuffer, outputBuffer)

Java

interpreter.run(inputBuffer, outputBuffer);

Aceleração de hardware

O LiteRT permite acelerar o desempenho do modelo usando processadores de hardware especializados, como unidades de processamento gráfico (GPUs). É possível aproveitar esses processadores especializados usando drivers de hardware chamados de delegados.

O delegado de GPU é fornecido pelo Google Play Services e é carregado dinamicamente, assim como as versões do Play Services da API Interpreter.

Como verificar a compatibilidade do dispositivo

Nem todos os dispositivos oferecem suporte à aceleração de hardware da GPU com o TFLite. Para reduzir erros e possíveis falhas, use o método TfLiteGpu.isGpuDelegateAvailable para verificar se um dispositivo é compatível com o delegado de GPU.

Use esse método para confirmar se um dispositivo é compatível com GPU e use a CPU como um substituto quando a GPU não for compatível.

useGpuTask = TfLiteGpu.isGpuDelegateAvailable(context)

Depois de ter uma variável como useGpuTask, você pode usá-la para determinar se os dispositivos usam o delegado de GPU.

Kotlin

val interpreterTask = useGpuTask.continueWith { task ->
  val interpreterOptions = InterpreterApi.Options()
      .setRuntime(TfLiteRuntime.FROM_SYSTEM_ONLY)
  if (task.result) {
      interpreterOptions.addDelegateFactory(GpuDelegateFactory())
  }
  InterpreterApi.create(FileUtil.loadMappedFile(context, MODEL_PATH), interpreterOptions)
}

Java

Task<InterpreterApi.Options> interpreterOptionsTask = useGpuTask.continueWith({ task ->
  InterpreterApi.Options options =
      new InterpreterApi.Options().setRuntime(TfLiteRuntime.FROM_SYSTEM_ONLY);
  if (task.getResult()) {
     options.addDelegateFactory(new GpuDelegateFactory());
  }
  return options;
});

GPU com APIs do Interpreter

Para usar o delegado de GPU com as APIs do interpretador:

Atualize as dependências do projeto para usar o delegado de GPU dos serviços do Google Play:
```
implementation 'com.google.android.gms:play-services-tflite-gpu:16.2.0'
```

Ative a opção de delegado da GPU na inicialização do TFlite:

Kotlin

TfLite.initialize(context,
  TfLiteInitializationOptions.builder()
    .setEnableGpuDelegateSupport(true)
    .build())

Java

TfLite.initialize(context,
  TfLiteInitializationOptions.builder()
    .setEnableGpuDelegateSupport(true)
    .build());

Ative o delegado de GPU nas opções do intérprete: defina a fábrica de delegados como GpuDelegateFactory chamando addDelegateFactory() withinInterpreterApi.Options()`:

Kotlin

val interpreterOption = InterpreterApi.Options()
  .setRuntime(TfLiteRuntime.FROM_SYSTEM_ONLY)
  .addDelegateFactory(GpuDelegateFactory())

Java

Options interpreterOption = InterpreterApi.Options()
  .setRuntime(TfLiteRuntime.FROM_SYSTEM_ONLY)
  .addDelegateFactory(new GpuDelegateFactory());

Migrar do LiteRT independente

Se você planeja migrar seu app do LiteRT independente para a API do Google Play Services, consulte as seguintes orientações adicionais para atualizar o código do projeto do app:

Consulte a seção Limitações para garantir que seu caso de uso seja compatível.
Antes de atualizar o código, recomendamos fazer verificações de desempenho e precisão dos modelos, principalmente se você estiver usando versões do LiteRT (TF Lite) anteriores à 2.1. Assim, você terá um valor de referência para comparar com a nova implementação.
Se você migrou todo o código para usar a API dos Serviços do Google Play para LiteRT, remova as dependências da biblioteca de tempo de execução do LiteRT (entradas com org.tensorflow:tensorflow-lite:*) do arquivo build.gradle para reduzir o tamanho do app.
Identifique todas as ocorrências de criação de objetos new Interpreter no seu código e modifique cada uma delas para usar a chamada InterpreterApi.create(). O novo TfLite.initialize é assíncrono, o que significa que, na maioria dos casos, ele não é uma substituição direta: é necessário registrar um listener para quando a chamada for concluída. Consulte o snippet de código na Etapa 3.
Adicione import org.tensorflow.lite.InterpreterApi; e import org.tensorflow.lite.InterpreterApi.Options.TfLiteRuntime; a qualquer arquivo de origem usando as classes org.tensorflow.lite.Interpreter ou org.tensorflow.lite.InterpreterApi.
Se alguma das chamadas resultantes para InterpreterApi.create() tiver apenas um argumento, adicione new InterpreterApi.Options() à lista de argumentos.
Anexe .setRuntime(TfLiteRuntime.FROM_SYSTEM_ONLY) ao último argumento de qualquer chamada para InterpreterApi.create().
Substitua todas as outras ocorrências da classe org.tensorflow.lite.Interpreter por org.tensorflow.lite.InterpreterApi.

Se você quiser usar o LiteRT independente e a API do Google Play Services lado a lado, use a versão 2.9 ou mais recente do LiteRT (TF Lite). O LiteRT (TF Lite) versão 2.8 e versões anteriores não são compatíveis com a versão da API dos Serviços do Google Play.