رویایی: AI Fairy Tales

AI Fairy Tales: با استفاده از Google API داستان های ویدیویی برای بچه ها ایجاد می کند.

کاری که انجام می دهد

من سیستمی ایجاد کرده ام که از آخرین مدل هوش مصنوعی گوگل، جمینی، برای تولید داستان های ویدئویی برای بچه ها استفاده می کند. مدل هوش مصنوعی اعلان‌های داستان و تصویر را ایجاد می‌کند، که سپس به Mini DALL-E ارسال می‌شود که توسط Google TPU Research Cloud on Hugging Face ارائه می‌شود. پشتیبان با پایتون 3، FastAPI و Uvicorn ساخته شده است. پس از ایجاد تصاویر، متن داستان توسط /coqui-ai/TTS پردازش می‌شود، که روی دستگاهی که توسط Contabo میزبانی می‌شود، نصب می‌شود تا یک فایل WAV/MP3 که با طول ویدیو مطابقت دارد تولید کند. همه عناصر با استفاده از MoviePy ترکیب شده و به کاربر بازگردانده می شوند. کاربران از طریق یک نقطه پایانی POST تعامل دارند که درخواست‌های یک یا چند کاراکتر را می‌پذیرد و ویدیوهای تولید شده را که به عنوان فایل‌های ثابت ذخیره می‌شوند، برمی‌گرداند. یک کار پس‌زمینه در صورت خرابی یا اگر ویدیوهای قدیمی‌تر از 30 روز باشند، فضا را خالی می‌کند. ظاهری که با React Native ساخته شده است، دارای یک رابط کاربری ساده با پخش کننده ویدیو، یک دکمه تولید تصادفی در صفحه اصلی و یک گزینه تولید سفارشی در صفحه ایجاد است که از حداکثر دو کاراکتر یا یک کاراکتر از پیش انتخاب شده از یک لیست پشتیبانی می کند. این برنامه که برای استفاده کودکان یا سرپرستان طراحی شده است، در حال حاضر در مرحله آزمایش است و انتظار می رود به زودی در فروشگاه Play تولید شود.

ساخته شده با

  • اندروید
  • مینی DALL-E
  • ارائه شده توسط Google TPU Research Cloud on Hugging Face.

تیم

توسط

باباستارها

از

ایالات متحده