DDMD

DDMD: デジタル薬物音楽検出

機能

DDMD プロジェクトは、デジタル薬物音楽を検出するための AI を活用したソリューションを提供することを目的としています。このプロセスは、著作権で保護されていない 3,176 個の MP3 ファイルの収集から始まります。このうち 1,676 個はデジタル薬物音楽に分類され、1,500 個はデジタル薬物音楽に分類されません。
これらのファイルは、音声ファイルをデジタル薬物音楽かどうかに分類できるランダム フォレスト ベースのモデルを開発するために使用されます。このモデルは、これらの音声ファイルから抽出された 34 個の特徴量を使用し、周波数ドメインと時間ドメインの両方の特性をカバーしています。非常に有望な結果が得られています。
結果をアクセスしやすくユーザー フレンドリーにするために、ウェブ アプリケーションを開発しました。このアプリケーションは、トレーニング済みのランダム フォレスト モデルを活用して、シンプルで直感的なインターフェースで音声ファイルを分類します。DDMD ウェブ アプリケーションは、バックエンドに Flask、フロントエンドに HTML/CSS を使用して構築されています。事前トレーニング済みのランダム フォレスト モデルを使用して予測を行い、さまざまな音声ファイル形式を受け入れ、MP3 以外のファイルを MP3 に変換し、YouTube URL 経由で入力できるようにします。
また、分類の精度を高めるために、Gemini-1.5-flash モデルをファインチューニングして DDMD アプリケーションを改善する方法も検討しています。2 つのアプローチを提案しました。まず、ランダム フォレスト分類結果に基づいて JSON データセットを準備し、Gemini-1.5-flash モデルをファインチューニングしました。2 つ目のアプローチでは、Gemini API を使用して、CSV や JSON など、さまざまな入力形式を試し、この Gemini モデルを微調整します。

構成

  • ウェブ/Chrome
  • Google Colab
  • Google スライド
  • Google の音声文字変換 AI

チーム

From

アルジェリア