MediaPipe Model Maker è uno strumento per personalizzare i modelli di machine learning (ML) esistenti in modo che funzionino con i dati e le applicazioni. Puoi usare questo strumento come alternativa più rapida alla creazione e all'addestramento di un nuovo modello ML. Model Maker utilizza una tecnica di addestramento ML chiamata Transfer Learning, che reimposta i modelli esistenti con nuovi dati. Questa tecnica riutilizza una porzione significativa della logica del modello esistente, il che significa che l'addestramento richiede meno tempo rispetto all'addestramento di un nuovo modello e può essere fatto con meno dati.
Model Maker funziona su vari tipi di modelli, tra cui rilevamento di oggetti, riconoscimento dei gesti o classificatori di immagini, testo o dati audio. Lo strumento riaddestra i modelli rimuovendo gli ultimi livelli del modello che classificano i dati in categorie specifiche e li ricrea utilizzando i nuovi dati forniti da te. Model Maker supporta anche alcune opzioni per ottimizzare i livelli dei modelli per migliorare accuratezza e prestazioni.
Figura 1. Model Maker rimuove gli ultimi livelli di un modello esistente e li ricrea con nuovi dati.
Il addestramento di un modello con Model Maker in genere riduce le dimensioni del modello, soprattutto se riaddestra il nuovo modello a riconoscere un numero inferiore di elementi. Ciò significa che puoi utilizzare Model Maker per creare modelli più mirati che funzionano meglio per la tua applicazione. Inoltre, lo strumento può aiutarti ad applicare tecniche ML come la quantizzazione, in modo che il modello utilizzi meno risorse
Requisiti dei dati di addestramento
Puoi utilizzare Model Maker per riaddestrare i modelli con un numero notevolmente inferiore di dati rispetto all'addestramento di un nuovo modello. Quando riaddestra un modello con nuovi dati, dovresti avere circa 100 campioni di dati per ogni classe addestrata. Ad esempio, se stai riaddestrando un modello di classificazione delle immagini per riconoscere gatti, cani e pappagalli, dovresti avere circa 100 immagini di gatti, 100 immagini di cani e 100 immagini di pappagalli. A seconda dell'applicazione, potresti essere in grado di riaddestrare un modello utile con ancora meno dati per categoria, anche se un set di dati più grande in genere migliora la precisione del modello. Quando crei il set di dati di addestramento, ricorda che i dati di addestramento vengono suddivisi durante il processo di riaddestramento, di solito l'80% per l'addestramento, il 10% per i test e il resto per la convalida.
Limitazioni della personalizzazione
Poiché il processo di riaddestramento rimuove i livelli di classificazione precedenti, il modello risultante può riconoscere solo gli elementi o le classi forniti nei nuovi dati. Se il vecchio modello è stato addestrato per riconoscere 30 diverse classi di elementi e utilizzi Model Maker per riaddestrare con i dati di 10 diversi elementi, il modello risultante è in grado di riconoscere solo quei 10 nuovi elementi.
Riaddestrando un modello con Model Maker non è possibile cambiare ciò che il modello ML originale è stato creato per risolvere, anche se i job sono simili. Ad esempio, non puoi usare lo strumento per far sì che un modello di classificazione delle immagini esegua il rilevamento di oggetti, anche se queste attività hanno alcune somiglianze.
Inizia
Puoi iniziare a utilizzare MediaPipe Model Maker eseguendo uno dei tutorial di personalizzazione delle soluzioni per MediaPipe, ad esempio Classificazione delle immagini