MediaPipe Model Maker ist ein Tool, mit dem Sie vorhandene Modelle für maschinelles Lernen (ML) so anpassen können, dass sie mit Ihren Daten und Anwendungen funktionieren. Dieses Tool ist eine schnellere Alternative zum Erstellen und Trainieren eines neuen ML-Modells. Model Maker verwendet eine ML-Trainingstechnik namens Lerntransfer, bei der vorhandene Modelle mit neuen Daten neu trainiert werden. Bei diesem Verfahren wird ein erheblicher Teil der vorhandenen Modelllogik wiederverwendet. Das bedeutet, dass das Training weniger Zeit in Anspruch nimmt als das Training eines neuen Modells und mit weniger Daten durchgeführt werden kann.
Model Maker arbeitet mit verschiedenen Modelltypen, darunter Objekterkennung, Gestenerkennung oder Klassifikatoren für Bilder, Text- oder Audiodaten. Das Tool trainiert Modelle neu, indem es die letzten Ebenen des Modells entfernt, die Daten in bestimmte Kategorien klassifizieren, und erstellt diese Ebenen mit den neu von Ihnen bereitgestellten Daten neu. Model Maker unterstützt auch einige Optionen zur Feinabstimmung von Modellebenen, um die Genauigkeit und Leistung zu verbessern.
Abbildung 1. Model Maker entfernt die letzten Ebenen eines vorhandenen Modells und erstellt sie mit neuen Daten neu.
Wenn Sie ein Modell mit Model Maker neu trainieren, wird das Modell in der Regel kleiner, insbesondere wenn Sie das neue Modell neu trainieren, damit weniger Dinge erkannt werden. So können Sie mit Model Maker fokussiertere Modelle erstellen, die besser für Ihre Anwendung geeignet sind. Das Tool kann Ihnen auch dabei helfen, ML-Techniken wie Quantisierung anzuwenden, damit Ihr Modell weniger Ressourcen verbraucht und effizienter arbeitet.
Anforderungen an Trainingsdaten
Sie können Model Maker verwenden, um Modelle mit deutlich weniger Daten als beim Trainieren eines neuen Modells neu zu trainieren. Wenn Sie ein Modell mit neuen Daten noch einmal trainieren, sollten Sie etwa 100 Datenbeispiele für jede trainierte Klasse haben. Wenn Sie beispielsweise ein Bildklassifizierungsmodell neu trainieren, um Katzen, Hunde und Papageien zu erkennen, sollten Sie etwa 100 Bilder von Katzen, 100 Bilder von Hunden und 100 Bilder von Papageien haben. Abhängig von Ihrer Anwendung können Sie möglicherweise ein nützliches Modell mit noch weniger Daten pro Kategorie neu trainieren, obwohl ein größeres Dataset im Allgemeinen die Genauigkeit Ihres Modells verbessert. Denken Sie beim Erstellen des Trainings-Datasets daran, dass Ihre Trainingsdaten während des erneuten Trainings aufgeteilt werden (in der Regel 80% für das Training, 10% für Tests und der Rest für die Validierung).
Einschränkungen der Anpassung
Da durch das erneute Training die vorherigen Klassifizierungsebenen entfernt werden, kann das resultierende Modell nur Elemente oder Klassen erkennen, die in den neuen Daten angegeben wurden. Wenn das alte Modell für das Erkennen von 30 verschiedenen Elementklassen trainiert wurde und Sie Model Maker verwenden, um ein erneutes Training mit Daten für 10 verschiedene Elemente durchzuführen, kann das resultierende Modell nur diese 10 neuen Elemente erkennen.
Wenn Sie ein Modell mit Model Maker neu trainieren, kann nichts daran geändert werden, für dessen Lösung das ursprüngliche ML-Modell erstellt wurde, selbst wenn diese Jobs ähnlich sind. Sie können das Tool beispielsweise nicht verwenden, um dafür zu sorgen, dass ein Bildklassifizierungsmodell eine Objekterkennung durchführt, auch wenn diese Aufgaben eine gewisse Ähnlichkeit haben.
Erste Schritte
Sie können mit der Verwendung von MediaPipe Model Maker beginnen, indem Sie eine der Anleitungen zur Lösungsanpassung für MediaPipe-Lösungen ausführen, z. B. Bildklassifizierung.