DDMD
डीडीएमडी: डिजिटल ड्रग म्यूज़िक डिटेक्टर
यह क्या करता है
डीडीएमडी प्रोजेक्ट का मकसद, एआई की मदद से, ड्रग्स से जुड़े संगीत का पता लगाने का समाधान उपलब्ध कराना है. यह प्रोसेस, बिना कॉपीराइट वाली 3,176 MP3 फ़ाइलों को इकट्ठा करने से शुरू होती है. इनमें से 1,676 फ़ाइलों को ड्रग्स से जुड़े संगीत के तौर पर और 1,500 फ़ाइलों को ड्रग्स से जुड़े संगीत के तौर पर नहीं रखा जाता.
इन फ़ाइलों का इस्तेमाल, रैंडम फ़ॉरेस्ट पर आधारित मॉडल बनाने के लिए किया जाता है. यह मॉडल, ऑडियो फ़ाइलों को ड्रग्स से जुड़े संगीत के तौर पर या न होने के तौर पर बांट सकता है. यह मॉडल, इन ऑडियो फ़ाइलों से निकाली गई 34 सुविधाओं का इस्तेमाल करता है. इनमें फ़्रीक्वेंसी और टाइम-डोमेन, दोनों की विशेषताएं शामिल हैं. इससे हमें बेहतर नतीजे मिले हैं.
नतीजों को ऐक्सेस करने और उन्हें उपयोगकर्ता के हिसाब से बनाने के लिए, हमने एक वेब ऐप्लिकेशन बनाया है. यह ऐप्लिकेशन, ऑडियो फ़ाइलों को आसान और सहज इंटरफ़ेस की मदद से अलग-अलग कैटगरी में बांटने के लिए, ट्रेन किए गए रैंडम फ़ॉरेस्ट मॉडल का इस्तेमाल करता है. DDMD वेब ऐप्लिकेशन को बैकएंड के लिए Flask और फ़्रंटएंड के लिए एचटीएमएल/सीएसएस का इस्तेमाल करके बनाया गया है. यह अनुमान लगाने के लिए, पहले से ट्रेन किए गए रैंडम फ़ॉरेस्ट मॉडल का इस्तेमाल करता है. साथ ही, यह अलग-अलग ऑडियो फ़ाइल फ़ॉर्मैट को स्वीकार करता है, MP3 फ़ाइलों को MP3 में बदलता है, और YouTube यूआरएल के ज़रिए इनपुट की अनुमति देता है.
इसके अलावा, कैटगरी तय करने की सटीक जानकारी देने के लिए, हम Gemini-1.5-फ़्लैश मॉडल को बेहतर बनाकर, डीडीएमडी ऐप्लिकेशन को बेहतर बनाने के तरीकों पर काम कर रहे हैं. हमने दो तरीके सुझाए हैं: पहला, Gemini-1.5-flash मॉडल को बेहतर बनाने के लिए, हमने रैंडम फ़ॉरेस्ट क्लासिफ़ायर के नतीजों के आधार पर JSON डेटासेट तैयार किया है. दूसरे तरीके में, हम Gemini एपीआई का इस्तेमाल कर रहे हैं. साथ ही, Gemini मॉडल को बेहतर बनाने के लिए, CSV और JSON जैसे अलग-अलग इनपुट फ़ॉर्मैट के साथ प्रयोग कर रहे हैं.
इनकी मदद से बनाया गया
- वेब/Chrome
- Google Colab
- Google Slides
- Google का बोली को टेक्स्ट में बदलने वाला एआई
टीम
इन्होंने भेजा
अल्जीरिया