Kreator modeli MediaPipe

MediaPipe Model Maker to narzędzie do dostosowywania istniejących modeli systemów uczących się do pracy z Twoimi danymi i aplikacjami. Może ono stanowić szybszą alternatywę dla tworzenia i trenowania nowego modelu ML. Kreator modeli wykorzystuje technikę trenowania systemów uczących się zwaną nauką transferu, która ponownie trenuje istniejące modele z użyciem nowych danych. Ta metoda wykorzystuje znaczną część dotychczasowej logiki modelu, co oznacza, że trenowanie trwa krócej niż trenowanie nowego modelu i można go przeprowadzić przy użyciu mniejszej ilości danych.

Kreator modeli obsługuje różne typy modeli, w tym wykrywanie obiektów, rozpoznawanie gestów i klasyfikatory obrazów, tekstu i danych audio. Narzędzie ponownie trenuje modele, usuwając kilka ostatnich warstw modelu, które klasyfikują dane do określonych kategorii, i odtwarza te warstwy, korzystając z nowych informacji podanych przez Ciebie. Kreator modeli obsługuje też pewne opcje dostosowywania warstw modelu w celu zwiększenia dokładności i wydajności.

Model systemów uczących się przedstawiający usuwanie i zastępowanie warstw klasyfikacji

Rysunek 1. Kreator modeli usuwa ostatnie warstwy istniejącego modelu i odbudowuje je z nowymi danymi.

Ponowne trenowanie modelu za pomocą Kreatora modeli zwykle go zmniejsza, zwłaszcza jeśli ponownie przeszkolisz nowy model tak, aby rozpoznawał mniej elementów. Oznacza to, że za pomocą Kreatora modeli możesz tworzyć bardziej precyzyjne modele, które lepiej sprawdzą się w przypadku Twojej aplikacji. Narzędzie to może też pomóc Ci w zastosowaniu technik ML, takich jak kwantyzacja, dzięki czemu model będzie wykorzystywać mniej zasobów i działa bardziej wydajnie.

Wymagania dotyczące danych treningowych

Za pomocą Kreatora modeli możesz ponownie trenować modele ze znacznie mniejszą ilością danych niż w przypadku nowego modelu. Ponowne trenowanie modelu z użyciem nowych danych powinno mieć około 100 próbek danych na każdą wytrenowaną klasę. Jeśli np. ponownie trenujesz model klasyfikacji obrazów, aby rozpoznawać koty, psy i papugi, musisz mieć około 100 zdjęć kotów, 100 zdjęć psów i 100 zdjęć papug. W zależności od aplikacji możesz ponownie wytrenować przydatny model z jeszcze mniejszą ilością danych na kategorię. Jednak większy zbiór danych zazwyczaj zwiększa dokładność modelu. Podczas tworzenia zbioru danych treningowych pamiętaj, że dane treningowe są dzielone podczas ponownego trenowania: 80% jest zwykle dzielone na trenowanie, 10% do testowania, a pozostałe do weryfikacji.

Ograniczenia dostosowywania

Proces ponownego trenowania usuwa poprzednie warstwy klasyfikacji, więc generowany model rozpoznaje tylko elementy lub klasy zawarte w nowych danych. Jeśli stary model został wytrenowany do rozpoznawania 30 różnych klas elementów i użyjesz Kreatora modeli do ponownego trenowania z użyciem danych dla 10 różnych elementów, wygenerowany model będzie w stanie rozpoznać tylko te 10 nowych elementów.

Ponowne wytrenowanie modelu za pomocą Kreatora modeli nie może zmienić rozwiązania, do którego został stworzony pierwotny model ML, nawet jeśli zadania te są podobne. Nie można na przykład użyć tego narzędzia, aby model klasyfikacji obrazów dokonywał wykrywania obiektów, mimo że zadania te są pewnego podobieństwa.

Rozpocznij

Aby zacząć korzystać z narzędzia MediaPipe Model Maker, możesz uruchomić jeden z samouczków dotyczących dostosowywania rozwiązań MediaPipe, np. Image Classification.