DDMD

DDMD: Digital Drug Music Detector

Funktion

Das DDMD-Projekt zielt darauf ab, eine KI-gestützte Lösung zum Erkennen von digitaler Drogenmusik bereitzustellen. Der Prozess beginnt mit der Sammlung von 3.176 nicht urheberrechtlich geschützten MP3-Dateien, von denen 1.676 als digitale Drogenmusik und 1.500 als nicht digitale Drogenmusik klassifiziert werden.
Anhand dieser Dateien wird ein Random-Forest-basiertes Modell entwickelt, mit dem Audiodateien als digitale Drogenmusik oder nicht digitale Drogenmusik klassifiziert werden können. Das Modell nutzt 34 Features, die aus diesen Audiodateien extrahiert wurden. Dabei werden sowohl Frequenz- als auch Zeitbereichsmerkmale abgedeckt. Die Ergebnisse sind sehr vielversprechend.
Um die Ergebnisse barrierefrei und nutzerfreundlich zu gestalten, haben wir eine Webanwendung entwickelt. Diese Anwendung nutzt das trainierte Random Forest-Modell, um Audiodateien über eine einfache und intuitive Benutzeroberfläche zu klassifizieren. Die DDMD-Webanwendung wurde mit Flask für das Backend und HTML/CSS für das Frontend erstellt. Es verwendet das vortrainierte Random-Forest-Modell, um Vorhersagen zu treffen. Es akzeptiert verschiedene Audiodateiformate, wandelt nicht MP3-Dateien in MP3-Dateien um und ermöglicht die Eingabe über eine YouTube-URL.
Um die Klassifizierungsgenauigkeit zu verbessern, prüfen wir außerdem, wie sich die DDMD-Anwendung durch eine Feinabstimmung des Gemini-1.5-Flash-Modells optimieren lässt. Wir haben zwei Ansätze vorgeschlagen: Erstens haben wir einen JSON-Datensatz basierend auf den Ergebnissen des Random-Forest-Klassifikators erstellt, um das Gemini-1.5-Flash-Modell zu optimieren. Beim zweiten Ansatz verwenden wir die Gemini API und experimentieren mit verschiedenen Eingabeformaten, einschließlich CSV und JSON, um dieses Gemini-Modell zu optimieren.

Basis

  • Web/Chrome
  • Google Colab
  • Google Präsentationen
  • Google-KI für die Spracheingabe

Team

Von

Algerien