ड्रीमी: एआई से बनी परियों की कहानियां

एआई फ़ेयरी टेल्स: Google API का इस्तेमाल करके, बच्चों के लिए वीडियो स्टोरी बनाता है.

यह क्या करता है

मैंने एक ऐसा सिस्टम बनाया है जो बच्चों के लिए वीडियो वाली कहानियां जनरेट करने के लिए, Google के नए एआई मॉडल Gemini का इस्तेमाल करता है. एआई मॉडल, कहानी और इमेज के प्रॉम्प्ट बनाता है. इसके बाद, उन्हें Mini DALL-E को भेजा जाता है. यह मॉडल, Hugging Face पर Google TPU Research Cloud की मदद से काम करता है. बैकएंड को Python 3, FastAPI, और Uvicorn के साथ बनाया गया है. इमेज बन जाने के बाद, कहानी के टेक्स्ट को /coqui-ai/TTS की मदद से प्रोसेस किया जाता है. यह टूल, Contabo की होस्ट की गई मशीन पर इंस्टॉल होता है. इससे, वीडियो की अवधि के हिसाब से WAV/MP3 फ़ाइल जनरेट होती है. सभी एलिमेंट को MoviePy का इस्तेमाल करके जोड़ दिया जाता है और उपयोगकर्ता को दिखा दिया जाता है. उपयोगकर्ता, पोस्ट एंडपॉइंट के ज़रिए इंटरैक्ट करते हैं. यह एंडपॉइंट, एक या उससे ज़्यादा वर्ण के प्रॉम्प्ट स्वीकार करता है और जनरेट किए गए वीडियो दिखाता है. ये वीडियो, स्टैटिक फ़ाइलों के तौर पर सेव किए जाते हैं. बैकग्राउंड में चलने वाली कोई जॉब, वीडियो के 30 दिन से ज़्यादा पुराने होने या वीडियो अपलोड न होने पर, स्टोरेज खाली कर देती है. React Native से बनाए गए फ़्रंटएंड में, वीडियो प्लेयर के साथ एक आसान यूज़र इंटरफ़ेस (यूआई) है. होम पेज पर, रैंडम जनरेशन बटन और बनाएं पेज पर कस्टम जनरेशन का विकल्प है. इसमें दो वर्ण या सूची में से पहले से चुना गया एक वर्ण इस्तेमाल किया जा सकता है. इस ऐप्लिकेशन को बच्चों या निगरानी करने वाले लोगों के इस्तेमाल के लिए डिज़ाइन किया गया है. फ़िलहाल, इसकी टेस्टिंग की जा रही है. उम्मीद है कि यह जल्द ही Play Store पर प्रोडक्शन के लिए उपलब्ध हो जाएगा.

इनका इस्तेमाल करके बनाया गया

  • Android
  • Mini DALL-E
  • Hugging Face पर Google TPU Research Cloud की मदद से काम करता है.

टीम

इन्होंने बदलाव किया है

Babastars

शुरू होने का समय

अमेरिका