DDMD
DDMD: Trình phát hiện nhạc số về ma tuý
Ý nghĩa
Dự án DDMD nhằm cung cấp một giải pháp dựa trên AI để phát hiện nhạc khiêu dâm kỹ thuật số. Quy trình này bắt đầu bằng việc thu thập 3.176 tệp MP3 không có bản quyền, trong đó 1.676 tệp được phân loại là nhạc kỹ thuật số về ma tuý và 1.500 tệp không phải là nhạc kỹ thuật số về ma tuý.
Các tệp này được dùng để phát triển một mô hình dựa trên Rừng ngẫu nhiên có thể phân loại tệp âm thanh là nhạc kỹ thuật số về ma tuý hay không phải là nhạc kỹ thuật số về ma tuý. Mô hình này sử dụng 34 đặc điểm được trích xuất từ các tệp âm thanh này, bao gồm cả đặc điểm tần số và miền thời gian, đồng thời đã đạt được kết quả rất đáng khích lệ.
Để giúp người dùng dễ dàng truy cập và sử dụng kết quả, chúng tôi đã phát triển một ứng dụng web. Ứng dụng này tận dụng mô hình Random Forest (Rừng ngẫu nhiên) đã huấn luyện để phân loại tệp âm thanh thông qua giao diện đơn giản và trực quan. Ứng dụng web DDMD được xây dựng bằng Flask cho phần phụ trợ và HTML/CSS cho phần giao diện người dùng. Ứng dụng này sử dụng mô hình Random Forest (Rừng ngẫu nhiên) được huấn luyện trước để đưa ra dự đoán, chấp nhận nhiều định dạng tệp âm thanh, chuyển đổi các tệp không phải MP3 sang MP3 và cho phép nhập thông tin qua URL YouTube.
Ngoài ra, để tăng độ chính xác phân loại, chúng tôi đang tìm hiểu các cách cải thiện ứng dụng DDMD bằng cách tinh chỉnh mô hình Gemini-1.5-flash. Chúng tôi đã đề xuất hai phương pháp: trước tiên, chúng tôi đã chuẩn bị một tập dữ liệu JSON dựa trên kết quả của bộ phân loại Random Forest để tinh chỉnh mô hình Gemini-1.5-flash. Trong phương pháp thứ hai, chúng tôi đang sử dụng API Gemini và thử nghiệm với nhiều định dạng đầu vào, bao gồm cả CSV và JSON, để tinh chỉnh mô hình Gemini này.
Được tạo bằng
- Web/Chrome
- Google Colab
- Google Trang trình bày
- Công nghệ AI của Google để chuyển văn bản sang lời nói
Nhóm
Từ
Algeria