MediaPipe Model Maker est un outil permettant de personnaliser des modèles de machine learning (ML) existants afin de les utiliser avec vos données et vos applications. Vous pouvez utiliser cet outil comme alternative plus rapide à la création et à l'entraînement d'un nouveau modèle de ML. Model Maker utilise une technique d'entraînement de ML appelée apprentissage par transfert, qui réentraîne des modèles existants avec de nouvelles données. Cette technique réutilise une partie significative de la logique du modèle existant, ce qui signifie que l'entraînement prend moins de temps que l'entraînement d'un nouveau modèle et peut être effectué avec moins de données.
Model Maker fonctionne sur différents types de modèles, y compris la détection d'objets, la reconnaissance de gestes ou les classificateurs d'images, de texte ou de données audio. L'outil réentraîne les modèles en supprimant les dernières couches du modèle qui classent les données dans des catégories spécifiques, puis à reconstruire ces couches à l'aide des nouvelles données que vous fournissez. Model Maker prend également en charge une option permettant d'affiner les couches de modèle afin d'améliorer la précision et les performances.
Figure 1. Model Maker supprime les dernières couches d'un modèle existant et les recompile avec de nouvelles données.
Le réentraînement d'un modèle à l'aide de Model Maker le réduit généralement, en particulier si vous entraînez le nouveau modèle pour qu'il reconnaisse moins d'éléments. Vous pouvez ainsi utiliser Model Maker pour créer des modèles plus ciblés et mieux adaptés à votre application. Cet outil peut également vous aider à appliquer des techniques de ML telles que la quantification afin que votre modèle utilise moins de ressources et s'exécute plus efficacement.
Exigences relatives aux données d'entraînement
Model Maker vous permet de réentraîner des modèles avec beaucoup moins de données que d'entraîner un nouveau modèle. Lorsque vous réentraînez un modèle avec de nouvelles données, vous devez viser à disposer d'environ 100 échantillons de données pour chaque classe entraînée. Par exemple, si vous réentraînez un modèle de classification d'images pour qu'il reconnaisse les chats, les chiens et les perroquets, vous devriez disposer d'environ 100 images de chats, 100 images de chiens et 100 images de perroquets. En fonction de votre application, vous pourrez peut-être réentraîner un modèle utile avec encore moins de données par catégorie. Toutefois, un ensemble de données plus volumineux améliore généralement la justesse du modèle. Lorsque vous créez votre ensemble de données d'entraînement, n'oubliez pas que vos données d'entraînement sont divisées lors du processus de réentraînement, généralement 80% pour l'entraînement, 10% pour le test et le reste pour la validation.
Limites de la personnalisation
Étant donné que le processus de réentraînement supprime les couches de classification précédentes, le modèle résultant ne peut reconnaître que les éléments, ou classes, fournis dans les nouvelles données. Si l'ancien modèle a été entraîné à reconnaître 30 classes d'éléments différentes et que vous utilisez Model Maker pour réentraîner 10 éléments différents avec des données, le modèle obtenu ne pourra reconnaître que ces 10 nouveaux éléments.
Le réentraînement d'un modèle avec Model Maker ne peut pas modifier ce à quoi le modèle de ML d'origine a été conçu, même si ces tâches sont similaires. Par exemple, vous ne pouvez pas l'utiliser pour faire en sorte qu'un modèle de classification d'images effectue la détection d'objets, même si ces tâches ont des similitudes.
Commencer
Vous pouvez commencer à utiliser MediaPipe Model Maker en exécutant l'un des tutoriels de personnalisation de la solution pour les solutions MediaPipe, tels que Classification d'images.