Criador de modelos do MediaPipe

O MediaPipe Model Maker é uma ferramenta para personalizar modelos de machine learning (ML) atuais para trabalhar com seus dados e aplicativos. É possível usar essa ferramenta como uma alternativa mais rápida para criar e treinar um novo modelo de ML. O Model Maker usa uma técnica de treinamento de ML chamada aprendizado por transferência, que treina novamente os modelos atuais com novos dados. Essa técnica reutiliza uma parte significativa da lógica do modelo atual, o que significa que o treinamento leva menos tempo do que o treinamento de um novo modelo e pode ser feito com menos dados.

O Model Maker funciona em vários tipos de modelos, incluindo detecção de objetos, reconhecimento de gestos ou classificadores de imagens, texto ou dados de áudio. A ferramenta treina os modelos novamente removendo as últimas camadas que classificam os dados em categorias específicas e as recria essas camadas usando os novos dados fornecidos. O Model Maker também oferece suporte a algumas opções para ajustar camadas do modelo para melhorar a precisão e o desempenho.

Modelo de machine learning mostrando as camadas de classificação sendo removidas e substituídas

Figura 1. O Model Maker remove as camadas finais de um modelo atual e as recria com dados novos.

Treinar novamente um modelo usando o Model Maker geralmente o torna menor, principalmente se você treinar novamente o novo modelo para reconhecer menos coisas. Isso significa que é possível usar o Model Maker para criar modelos mais focados que funcionam melhor para seu aplicativo. A ferramenta também pode ajudar você a aplicar técnicas de ML, como a quantização, para que o modelo use menos recursos e seja executado com mais eficiência.

Requisitos dos dados de treinamento

É possível usar o Model Maker para treinar novamente os modelos com uma quantidade significativamente menor de dados do que treinar um novo modelo. Ao treinar novamente um modelo com dados novos, você precisa ter aproximadamente 100 amostras de dados para cada classe treinada. Por exemplo, se você estiver treinando novamente um modelo de classificação de imagens para reconhecer gatos, cães e papagaios, será preciso ter cerca de 100 imagens de gatos, 100 imagens de cães e 100 imagens de papagaios. Dependendo do aplicativo, é possível treinar novamente um modelo útil com ainda menos dados por categoria, embora um conjunto de dados maior geralmente melhore a acurácia do modelo. Ao criar o conjunto de dados de treinamento, lembre-se de que eles são divididos durante o processo de retreinamento, normalmente 80% para treinamento, 10% para teste e o restante para validação.

Limitações da personalização

Como o processo de retreinamento remove as camadas de classificação anteriores, o modelo resultante só pode reconhecer itens, ou classes, fornecidos nos novos dados. Se o modelo antigo foi treinado para reconhecer 30 classes de itens diferentes e você usar o Model Maker para treinar novamente com dados de 10 itens diferentes, o modelo resultante só será capaz de reconhecer esses 10 novos itens.

Treinar novamente um modelo com o Model Maker não pode alterar o que o modelo de ML original foi criado para resolver, mesmo que esses jobs sejam semelhantes. Por exemplo, não é possível usar a ferramenta para fazer um modelo de classificação de imagens realizar a detecção de objetos, mesmo que essas tarefas tenham alguma semelhança.

Começar

Comece a usar o MediaPipe Model Maker executando um dos tutoriais de personalização para soluções do MediaPipe, como Classificação de imagens.