Dreamy: حكايات خرافية من إنشاء الذكاء الاصطناعي
AI Fairy Tales: لإنشاء قصص فيديو للأطفال باستخدام Google APIs
وظيفتها
لقد أنشأتُ نظامًا يستخدم أحدث نموذج من نماذج الذكاء الاصطناعي من Google، وهو Gemini، لإنشاء قصص فيديو للأطفال. ينشئ نموذج الذكاء الاصطناعي طلبات القصص والصور، ويتم تمريرها بعد ذلك إلى Mini DALL-E، الذي يستند إلى Google TPU Research Cloud على Hugging Face. تم إنشاء الخلفية باستخدام Python 3 وFastAPI وUvicorn. بعد إنشاء الصور، تتم معالجة نص القصة من خلال /coqui-ai/TTS، الذي تم تثبيته على جهاز يستضيفه Contabo، لإنشاء ملف WAV/MP3 يتطابق مع مدة الفيديو. يتم دمج جميع العناصر باستخدام MoviePy وإعادتها إلى المستخدم. يتفاعل المستخدمون من خلال نقطة نهاية POST التي تقبل طلبات بحرف واحد أو عدة أحرف وتُعيد الفيديوهات التي تم إنشاؤها والتي يتم تخزينها كملفات ثابتة. تعمل المهمة التي تعمل في الخلفية على إزالة المساحة في حال حدوث أخطاء أو إذا مرّ أكثر من 30 يومًا على الفيديوهات. واجهة المستخدم، التي تم إنشاؤها باستخدام React Native، تتضمّن واجهة مستخدم بسيطة مع مشغّل فيديو وزر إنشاء عشوائي على الصفحة الرئيسية وخيار إنشاء مخصّص على صفحة الإنشاء، مع إمكانية إنشاء ما يصل إلى حرفَين أو حرف محدّد مسبقًا من قائمة. تم تصميم التطبيق ليستخدمه الأطفال أو المشرفون، وهو قيد الاختبار حاليًا ومن المتوقّع أن يتم طرحه في "متجر Play" قريبًا.
مصمَّم بالاستناد إلى
- Android
- Mini DALL-E
- مدعوم من Google TPU Research Cloud على Hugging Face
الفريق
من
Babastars
من
الولايات المتحدة