DDMD
DDMD: 디지털 마약 음악 감지기
기능
DDMD 프로젝트는 디지털 마약 음악을 감지하기 위한 AI 기반 솔루션을 제공하는 것을 목표로 합니다. 이 프로세스는 저작권이 없는 MP3 파일 3,176개를 수집하는 것으로 시작됩니다. 이 중 1,676개는 디지털 마약 음악으로 분류되고 1,500개는 디지털 마약 음악이 아닙니다.
이 파일은 오디오 파일을 디지털 마약 음악인지 아닌지로 분류할 수 있는 랜덤 포레스트 기반 모델을 개발하는 데 사용됩니다. 이 모델은 이러한 오디오 파일에서 추출된 34가지 특성을 활용하여 주파수 및 시간 영역 특성을 모두 다루며 매우 고무적인 결과를 얻었습니다.
결과를 쉽게 액세스하고 사용자 친화적으로 만들기 위해 웹 애플리케이션을 개발했습니다. 이 애플리케이션은 학습된 랜덤 포레스트 모델을 활용하여 간단하고 직관적인 인터페이스를 통해 오디오 파일을 분류합니다. DDMD 웹 애플리케이션은 백엔드에 Flask를, 프런트엔드에 HTML/CSS를 사용하여 빌드됩니다. 사전 학습된 랜덤 포레스트 모델을 활용하여 예측을 수행하고, 다양한 오디오 파일 형식을 허용하며, MP3가 아닌 파일을 MP3로 변환하고, YouTube URL을 통해 입력을 허용합니다.
또한 분류 정확도를 높이기 위해 Gemini-1.5-flash 모델을 미세 조정하여 DDMD 애플리케이션을 개선하는 방법을 모색하고 있습니다. 두 가지 접근 방식을 제안했습니다. 첫 번째는 랜덤 포레스트 분류 결과를 기반으로 JSON 데이터 세트를 준비하여 Gemini-1.5-flash 모델을 미세 조정하는 것입니다. 두 번째 접근 방식에서는 Gemini API를 사용하고 CSV 및 JSON을 비롯한 다양한 입력 형식을 실험하여 이 Gemini 모델을 미세 조정합니다.
구성용 제품
- 웹/Chrome
- Google Colab
- Google Slides
- Google 음성 텍스트 변환 AI
팀
From
알제리