DDMD

DDMD: آشکارساز دیجیتالی موسیقی مواد مخدر

کاری که انجام می دهد

هدف پروژه DDMD ارائه راه حلی مبتنی بر هوش مصنوعی برای تشخیص موسیقی دیجیتال مواد مخدر است. این فرآیند با جمع‌آوری 3176 فایل MP3 بدون حق نسخه‌برداری آغاز می‌شود که از این تعداد 1676 به عنوان موسیقی دیجیتال مواد مخدر و 1500 فایل به عنوان موسیقی غیر دیجیتال مواد مخدر طبقه‌بندی می‌شوند.
از این فایل‌ها برای توسعه یک مدل مبتنی بر جنگل تصادفی استفاده می‌شود که می‌تواند فایل‌های صوتی را به عنوان موسیقی دیجیتال دارویی یا غیرقابل طبقه‌بندی کند. این مدل از 34 ویژگی استخراج شده از این فایل های صوتی استفاده می کند که هم ویژگی های فرکانس و هم دامنه زمانی را پوشش می دهد و نتایج بسیار دلگرم کننده ای به دست آورده است.
برای اینکه نتایج را در دسترس و کاربرپسند کنیم، یک برنامه وب ایجاد کردیم. این نرم افزار از مدل Random Forest آموزش دیده برای طبقه بندی فایل های صوتی از طریق یک رابط کاربری ساده و بصری استفاده می کند. برنامه وب DDMD با استفاده از Flask برای Backend و HTML/CSS برای Frontend ساخته شده است. از مدل جنگل تصادفی از پیش آموزش‌دیده برای پیش‌بینی، پذیرش فرمت‌های فایل صوتی مختلف، تبدیل فایل‌های غیر MP3 به MP3 و اجازه ورود از طریق URL YouTube استفاده می‌کند.
علاوه بر این، برای افزایش دقت طبقه بندی، ما در حال بررسی راه هایی برای بهبود برنامه DDMD با تنظیم دقیق مدل Gemini-1.5-flash هستیم. ما دو رویکرد را پیشنهاد کرده‌ایم: اول، یک مجموعه داده JSON بر اساس نتایج طبقه‌بندی‌کننده جنگل تصادفی برای تنظیم دقیق مدل فلاش Gemini-1.5 آماده کردیم. در رویکرد دوم، ما از Gemini API استفاده می‌کنیم و با فرمت‌های ورودی مختلف، از جمله CSV و JSON، برای تنظیم دقیق این مدل Gemini، آزمایش می‌کنیم.

ساخته شده با

  • وب/کروم
  • گوگل کولب
  • اسلایدهای گوگل
  • Google Spech-to-Text AI

تیم

از

الجزایر