MediaPipe Model Maker 這項工具可用於自訂現有機器學習 (ML) 模型,以搭配資料和應用程式使用。您可以利用這項工具,以更快速的替代方法,建構及訓練新的機器學習模型。模型製作工具採用名為遷移學習的機器學習訓練技術,可運用新資料重新訓練現有模型。這項技術會重複使用大部分現有模型邏輯的部分,這表示訓練所需時間比訓練新模型少,而且可減少的資料量。
Model Maker 適用於多種模型,包括物件偵測、手勢辨識或圖片、文字或音訊資料的分類器。這項工具會移除模型最後幾個層,將分類資料歸類到特定類別的模型,然後利用您提供的新資料重新建構這些圖層。模型製作工具也可以讓您選擇微調模型層,進而改善準確率和效能。
圖 1. Model Maker 會移除現有模型的最終層,並以新資料重建這些層。
使用 Model Maker 重新訓練模型時,一般會縮減模型,尤其如果您重新訓練新模型,以便識別較少內容,這表示您可以使用 Model Maker 建立更聚焦於應用程式的模型。這項工具還能協助您運用量化等機器學習技術 減少模型消耗的資源,提升執行效率
訓練資料需求
您可以使用 Model Maker 來重新訓練模型,但資料量比訓練新模型少很多。使用新資料重新訓練模型時,建議為每個訓練的類別各提供約 100 個資料樣本。舉例來說,如要重新訓練圖片分類模型來辨識貓、狗和鸚鵡,則應有大約 100 張圖片、100 張狗圖片,以及 100 張鸚鵡的圖片。視應用程式而定,您或許可以重新訓練實用的模型,每個類別的資料量甚至更少。不過,較大的資料集通常可以提高模型的準確度。建立訓練資料集時,請記得在重新訓練程序中,訓練資料分成 80%、測試用的其餘部分為 10%,其餘用於驗證作業的餘量。
自訂限制
由於重新訓練程序會移除先前的分類層,因此產生的模型只能辨識新資料中提供的項目或類別。如果舊模型經過訓練,能夠辨識 30 個不同的項目類別,且您使用 Model Maker 使用 10 個不同項目的資料重新訓練,則產生的模型只能辨識這 10 個新項目。
使用 Model Maker 重新訓練模型後,就無法變更原始機器學習模型建構來解決問題,即使這些工作相似也一樣。舉例來說,您無法使用這項工具讓圖片分類模型執行物件偵測,即使這些工作有部分相似性。
開始使用
您可以執行其中一個 MediaPipe Solutions 的解決方案自訂教學課程 (例如 Image Classification),開始使用 MediaPipe Model Maker