DDMD

DDMD:数字毒品音乐检测器

作用

DDMD 项目旨在提供 AI 赋能的解决方案,用于检测数字毒品音乐。该流程从收集 3,176 个不受版权保护的 MP3 文件开始,其中 1,676 个被归类为数字毒品音乐,1,500 个被归类为非数字毒品音乐。
这些文件用于开发基于随机森林的模型,该模型可以将音频文件分类为数字毒品音乐或非数字毒品音乐。该模型利用从这些音频文件中提取的 34 个特征(涵盖频域和时域特征),取得了非常令人鼓舞的结果。
为了让用户能够轻松访问结果,我们开发了一款 Web 应用。此应用利用训练好的随机森林模型,通过简单直观的界面对音频文件进行分类。DDMD Web 应用使用 Flask 作为后端,使用 HTML/CSS 作为前端构建而成。该模型利用预训练的随机森林模型进行预测,接受各种音频文件格式,将非 MP3 文件转换为 MP3,并允许通过 YouTube 网址输入内容。
此外,为了提高分类准确性,我们正在探索通过微调 Gemini-1.5-flash 模型来改进 DDMD 应用的方法。我们提出了两种方法:首先,我们根据随机森林分类器结果准备了 JSON 数据集,以微调 Gemini-1.5-flash 模型。在第二种方法中,我们使用 Gemini API 并尝试不同的输入格式(包括 CSV 和 JSON),以微调此 Gemini 模型。

可采用以下设备打造

  • Web/Chrome
  • Google Colab
  • Google 幻灯片
  • Google 语音转文字 AI

团队

发件人

阿尔及利亚