Trình tạo mô hình MediaPipe

Trình tạo mô hình MediaPipe là công cụ giúp tuỳ chỉnh các mô hình học máy (ML) hiện có để hoạt động với dữ liệu và ứng dụng của bạn. Bạn có thể sử dụng công cụ này như một giải pháp thay thế nhanh hơn để xây dựng và huấn luyện một mô hình học máy mới. Model Maker sử dụng kỹ thuật huấn luyện ML có tên là transfer learning (học tập chuyển tiếp) để đào tạo lại các mô hình hiện có bằng dữ liệu mới. Kỹ thuật này sử dụng lại một phần đáng kể của logic mô hình hiện có, tức là việc huấn luyện sẽ mất ít thời gian hơn so với huấn luyện một mô hình mới và có thể được thực hiện với ít dữ liệu hơn.

Model Maker hoạt động trên nhiều loại mô hình, bao gồm cả việc phát hiện vật thể, nhận dạng cử chỉ hoặc các thuật toán phân loại cho dữ liệu hình ảnh, văn bản hoặc âm thanh. Công cụ này đào tạo lại các mô hình bằng cách xoá vài lớp cuối cùng của mô hình giúp phân loại dữ liệu thành các danh mục cụ thể, và tạo lại các lớp đó bằng cách sử dụng dữ liệu mới mà bạn cung cấp. Model Maker cũng hỗ trợ một số tuỳ chọn tinh chỉnh các lớp mô hình nhằm cải thiện độ chính xác và hiệu suất.

Mô hình học máy cho thấy các lớp phân loại bị xoá và thay thế

Hình 1. Trình tạo mô hình sẽ xoá các lớp cuối cùng của mô hình hiện có và tạo lại các lớp đó bằng dữ liệu mới.

Việc huấn luyện lại mô hình bằng Trình tạo mô hình thường sẽ làm cho mô hình nhỏ hơn, đặc biệt là nếu bạn huấn luyện lại mô hình mới để nhận ra ít thứ hơn. Điều này có nghĩa là bạn có thể sử dụng Trình tạo mô hình để tạo các mô hình tập trung hơn, phù hợp hơn với ứng dụng của mình. Công cụ này cũng có thể giúp bạn áp dụng các kỹ thuật học máy như lượng tử hoá, nhờ đó, mô hình cần ít tài nguyên hơn và chạy hiệu quả hơn.

Yêu cầu về dữ liệu huấn luyện

Bạn có thể sử dụng Trình tạo mô hình để đào tạo lại các mô hình có ít dữ liệu hơn đáng kể so với việc huấn luyện một mô hình mới. Khi huấn luyện lại một mô hình bằng dữ liệu mới, bạn nên đặt mục tiêu có khoảng 100 mẫu dữ liệu cho mỗi lớp được huấn luyện. Ví dụ: nếu bạn đang huấn luyện lại một mô hình phân loại hình ảnh để nhận dạng mèo, chó và vẹt, bạn nên có khoảng 100 hình ảnh về mèo, 100 hình ảnh về chó và 100 hình ảnh về vẹt. Tuỳ thuộc vào ứng dụng, bạn có thể đào tạo lại một mô hình hữu ích với ít dữ liệu hơn trên mỗi danh mục, mặc dù tập dữ liệu lớn hơn thường cải thiện độ chính xác của mô hình. Khi tạo tập dữ liệu huấn luyện, hãy nhớ rằng dữ liệu huấn luyện của bạn sẽ được chia nhỏ trong quá trình đào tạo lại, thường là 80% cho việc huấn luyện, 10% cho việc kiểm thử và phần còn lại để xác thực.

Giới hạn của việc tuỳ chỉnh

Do quy trình đào tạo lại sẽ xoá các lớp phân loại trước đó, nên mô hình thu được chỉ có thể nhận ra các mục hoặc lớp được cung cấp trong dữ liệu mới. Nếu mô hình cũ được huấn luyện để nhận ra 30 lớp mục khác nhau và bạn sử dụng Model Maker để đào tạo lại bằng dữ liệu cho 10 mục khác nhau, thì mô hình thu được chỉ có thể nhận ra 10 mục mới đó.

Việc huấn luyện lại mô hình bằng Trình tạo mô hình không thể thay đổi nội dung mà mô hình học máy ban đầu được tạo ra để giải quyết, ngay cả khi các công việc đó tương tự nhau. Ví dụ: bạn không thể sử dụng công cụ để tạo mô hình phân loại hình ảnh thực hiện tính năng phát hiện đối tượng, mặc dù các tác vụ đó có một số điểm tương đồng.

Bắt đầu

Bạn có thể bắt đầu sử dụng Trình tạo mô hình MediaPipe bằng cách chạy một trong các Hướng dẫn tuỳ chỉnh giải pháp cho các Giải pháp của MediaPipe, chẳng hạn như Phân loại hình ảnh