Introdução aos microcontroladores

Neste documento, explicamos como treinar um modelo e executar a inferência usando um microcontrolador.

O exemplo de Hello World

A Hello World (link em inglês) exemplo, foi criado para demonstrar os fundamentos básicos do uso da LiteRT para microcontroladores. Treinamos e executamos um modelo que replica uma função seno ou seja, recebe um único número como entrada e gera a saída sine. Quando implantados no microcontrolador, suas previsões são usadas para piscar os LEDs ou controlar um animação.

O fluxo de trabalho completo envolve as seguintes etapas:

  1. Treinar um modelo (em Python): um arquivo Python para treinar, converter e otimizar um modelo para uso no dispositivo.
  2. Executar inferência (em C++ 17): um teste de unidade completo que executa a inferência no modelo usando a biblioteca C++.

Usar um dispositivo com suporte

O aplicativo de exemplo que usaremos foi testado nos seguintes dispositivos:

Saiba mais sobre as plataformas compatíveis em LiteRT para microcontroladores (em inglês)

Treinar um modelo

Usar train.py para treinamento de modelo "Hello World" para reconhecimento sinwave

Executar: bazel build tensorflow/lite/micro/examples/hello_world:train bazel-bin/tensorflow/lite/micro/examples/hello_world/train --save_tf_model --save_dir=/tmp/model_created/

Executar inferência

Para executar o modelo em seu dispositivo, vamos seguir as instruções na README.md:

Olá README.md mundial

As seções a seguir mostram as etapas evaluate_test.cc, um teste de unidade, que demonstra como executar inferência usando o LiteRT para Microcontroladores. Ele carrega o modelo e executa a inferência várias vezes.

1. Incluir os cabeçalhos da biblioteca

Para usar a biblioteca LiteRT para microcontroladores, é necessário incluir o elemento seguintes arquivos de cabeçalho:

#include "tensorflow/lite/micro/micro_mutable_op_resolver.h"
#include "tensorflow/lite/micro/micro_error_reporter.h"
#include "tensorflow/lite/micro/micro_interpreter.h"
#include "tensorflow/lite/schema/schema_generated.h"
#include "tensorflow/lite/version.h"

2. Incluir o cabeçalho do modelo

O intérprete da LiteRT para microcontroladores espera que o modelo seja fornecido como uma matriz C++. O modelo é definido nos arquivos model.h e model.cc. O cabeçalho é incluído com a seguinte linha:

#include "tensorflow/lite/micro/examples/hello_world/model.h"

3. Incluir o cabeçalho do framework de teste de unidade

Para criar um teste de unidade, incluímos o LiteRT para Framework de teste de unidade de microcontroladores incluindo a seguinte linha:

#include "tensorflow/lite/micro/testing/micro_test.h"

O teste é definido usando as seguintes macros:

TF_LITE_MICRO_TESTS_BEGIN

TF_LITE_MICRO_TEST(LoadModelAndPerformInference) {
  . // add code here
  .
}

TF_LITE_MICRO_TESTS_END

Agora, vamos falar sobre o código incluído na macro acima.

4. Configurar a geração de registros

Para configurar a geração de registros, um ponteiro tflite::ErrorReporter é criado usando um a uma instância de tflite::MicroErrorReporter:

tflite::MicroErrorReporter micro_error_reporter;
tflite::ErrorReporter* error_reporter = &micro_error_reporter;

Essa variável será transmitida ao intérprete, que permite que ele grave ou de sistemas operacionais de contêineres. Como os microcontroladores geralmente têm uma variedade de mecanismos para a geração de registros, o A implementação de tflite::MicroErrorReporter foi projetada para ser personalizada seu dispositivo específico.

5. Carregar um modelo

No código abaixo, o modelo é instanciado usando dados de uma matriz char. g_model, que é declarado em model.h. Em seguida, verificamos o modelo para garantir que schema.org é compatível com a versão que estamos usando:

const tflite::Model* model = ::tflite::GetModel(g_model);
if (model->version() != TFLITE_SCHEMA_VERSION) {
  TF_LITE_REPORT_ERROR(error_reporter,
      "Model provided is schema version %d not equal "
      "to supported version %d.\n",
      model->version(), TFLITE_SCHEMA_VERSION);
}

6. Instanciar o resolvedor de operações

Um MicroMutableOpResolver instância seja declarada. Isso será usado pelo intérprete para registrar e acesse as operações usadas pelo modelo:

using HelloWorldOpResolver = tflite::MicroMutableOpResolver<1>;

TfLiteStatus RegisterOps(HelloWorldOpResolver& op_resolver) {
  TF_LITE_ENSURE_STATUS(op_resolver.AddFullyConnected());
  return kTfLiteOk;

O MicroMutableOpResolver requer um parâmetro de modelo que indique o número de operações que serão registradas. A função RegisterOps registra as operações com o resolvedor.

HelloWorldOpResolver op_resolver;
TF_LITE_ENSURE_STATUS(RegisterOps(op_resolver));

7. Alocar memória

Precisamos pré-alocar um certo volume de memória para entrada, saída e matrizes intermediárias. Isso é fornecido como uma matriz uint8_t de tamanho tensor_arena_size:

const int tensor_arena_size = 2 * 1024;
uint8_t tensor_arena[tensor_arena_size];

O tamanho necessário dependerá do modelo que você estiver usando e poderá precisar ser são determinados pela experimentação.

8. Intérprete de instanciação

Criamos uma instância tflite::MicroInterpreter, transmitindo as variáveis criada anteriormente:

tflite::MicroInterpreter interpreter(model, resolver, tensor_arena,
                                     tensor_arena_size, error_reporter);

9. Alocar tensores

Instruímos o intérprete a alocar memória do tensor_arena para o tensores do modelo:

interpreter.AllocateTensors();

10. Validar o formato da entrada

A instância MicroInterpreter pode fornecer um ponteiro para o Tensor de entrada chamando .input(0), em que 0 representa o primeiro (e único) tensor de entrada:

  // Obtain a pointer to the model's input tensor
  TfLiteTensor* input = interpreter.input(0);

Em seguida, inspecionamos o tensor para confirmar que a forma e o tipo dele são os mesmos esperando:

// Make sure the input has the properties we expect
TF_LITE_MICRO_EXPECT_NE(nullptr, input);
// The property "dims" tells us the tensor's shape. It has one element for
// each dimension. Our input is a 2D tensor containing 1 element, so "dims"
// should have size 2.
TF_LITE_MICRO_EXPECT_EQ(2, input->dims->size);
// The value of each element gives the length of the corresponding tensor.
// We should expect two single element tensors (one is contained within the
// other).
TF_LITE_MICRO_EXPECT_EQ(1, input->dims->data[0]);
TF_LITE_MICRO_EXPECT_EQ(1, input->dims->data[1]);
// The input is a 32 bit floating point value
TF_LITE_MICRO_EXPECT_EQ(kTfLiteFloat32, input->type);

O valor de enumeração kTfLiteFloat32 é uma referência a um dos tipos de dados e é definida em common.h.

11. Fornecer um valor de entrada

Para fornecer uma entrada ao modelo, definimos o conteúdo do tensor de entrada, como da seguinte forma:

input->data.f[0] = 0.;

Nesse caso, inserimos um valor de ponto flutuante que representa 0.

12. Executar o modelo

Para executar o modelo, podemos chamar Invoke() na tflite::MicroInterpreter instância:

TfLiteStatus invoke_status = interpreter.Invoke();
if (invoke_status != kTfLiteOk) {
  TF_LITE_REPORT_ERROR(error_reporter, "Invoke failed\n");
}

Podemos verificar o valor de retorno, um TfLiteStatus, para determinar se a execução foi bem-sucedido. Os valores possíveis de TfLiteStatus, definidos em common.h, são kTfLiteOk e kTfLiteError.

O código a seguir declara que o valor é kTfLiteOk, o que significa que a inferência foi executada com sucesso.

TF_LITE_MICRO_EXPECT_EQ(kTfLiteOk, invoke_status);

13. Receber a saída

Para acessar o tensor de saída do modelo, chame output(0) no tflite::MicroInterpreter, em que 0 representa a primeira (e única) saída. .

No exemplo, a saída do modelo é um único valor de ponto flutuante contido em um tensor 2D:

TfLiteTensor* output = interpreter.output(0);
TF_LITE_MICRO_EXPECT_EQ(2, output->dims->size);
TF_LITE_MICRO_EXPECT_EQ(1, input->dims->data[0]);
TF_LITE_MICRO_EXPECT_EQ(1, input->dims->data[1]);
TF_LITE_MICRO_EXPECT_EQ(kTfLiteFloat32, output->type);

Podemos ler o valor diretamente do tensor de saída e declarar que é o que esperamos:

// Obtain the output value from the tensor
float value = output->data.f[0];
// Check that the output value is within 0.05 of the expected value
TF_LITE_MICRO_EXPECT_NEAR(0., value, 0.05);

14. Executar inferência novamente

O restante do código executa a inferência várias vezes. Em cada caso, atribuímos um valor ao tensor de entrada, invocamos o intérprete e lemos o do tensor de saída:

input->data.f[0] = 1.;
interpreter.Invoke();
value = output->data.f[0];
TF_LITE_MICRO_EXPECT_NEAR(0.841, value, 0.05);

input->data.f[0] = 3.;
interpreter.Invoke();
value = output->data.f[0];
TF_LITE_MICRO_EXPECT_NEAR(0.141, value, 0.05);

input->data.f[0] = 5.;
interpreter.Invoke();
value = output->data.f[0];
TF_LITE_MICRO_EXPECT_NEAR(-0.959, value, 0.05);