ड्रीमी: एआई से बनी परियों की कहानियां
एआई फ़ेयरी टेल्स: Google API का इस्तेमाल करके, बच्चों के लिए वीडियो स्टोरी बनाता है.
यह क्या करता है
मैंने एक ऐसा सिस्टम बनाया है जो बच्चों के लिए वीडियो वाली कहानियां जनरेट करने के लिए, Google के नए एआई मॉडल, Gemini का इस्तेमाल करता है. एआई मॉडल, कहानी और इमेज के प्रॉम्प्ट बनाता है. इसके बाद, उन्हें Mini DALL-E को भेजा जाता है. यह मॉडल, Hugging Face पर Google TPU Research Cloud की मदद से काम करता है. बैकएंड को Python 3, FastAPI, और Uvicorn की मदद से बनाया गया है. इमेज बन जाने के बाद, कहानी के टेक्स्ट को /coqui-ai/TTS की मदद से प्रोसेस किया जाता है. यह टूल, Contabo की होस्ट की गई मशीन पर इंस्टॉल होता है. इससे, वीडियो की अवधि के हिसाब से WAV/MP3 फ़ाइल जनरेट होती है. सभी एलिमेंट को MoviePy का इस्तेमाल करके जोड़ दिया जाता है और उपयोगकर्ता को दिखा दिया जाता है. उपयोगकर्ता, पोस्ट एंडपॉइंट के ज़रिए इंटरैक्ट करते हैं. यह एंडपॉइंट, एक या उससे ज़्यादा वर्ण के प्रॉम्प्ट स्वीकार करता है और जनरेट किए गए वीडियो दिखाता है. ये वीडियो, स्टैटिक फ़ाइलों के तौर पर सेव किए जाते हैं. बैकग्राउंड में चलने वाली कोई जॉब, वीडियो के 30 दिन से ज़्यादा पुराने होने या वीडियो अपलोड न होने पर, स्टोरेज खाली कर देती है. React Native की मदद से बनाए गए फ़्रंटएंड में, वीडियो प्लेयर के साथ एक आसान यूज़र इंटरफ़ेस (यूआई) है. होम पेज पर, रैंडम जनरेशन बटन और बनाएं पेज पर कस्टम जनरेशन का विकल्प मौजूद है. इसमें दो वर्ण या सूची में से पहले से चुना गया एक वर्ण इस्तेमाल किया जा सकता है. इस ऐप्लिकेशन को बच्चों या निगरानी करने वाले लोगों के इस्तेमाल के लिए डिज़ाइन किया गया है. फ़िलहाल, इसकी टेस्टिंग की जा रही है. उम्मीद है कि यह जल्द ही Play Store पर प्रोडक्शन के लिए उपलब्ध हो जाएगा.
इनकी मदद से बनाया गया
- Android
- Mini DALL-E
- Hugging Face पर Google TPU Research Cloud की मदद से उपलब्ध है.
टीम
इन्होंने बदलाव किया है
Babastars
इन्होंने भेजा
अमेरिका