رویایی: AI Fairy Tales
AI Fairy Tales: با استفاده از Google API داستان های ویدیویی برای بچه ها ایجاد می کند.
کاری که انجام می دهد
من سیستمی ایجاد کرده ام که از آخرین مدل هوش مصنوعی گوگل، جمینی، برای تولید داستان های ویدئویی برای بچه ها استفاده می کند. مدل هوش مصنوعی اعلانهای داستان و تصویر را ایجاد میکند، که سپس به Mini DALL-E ارسال میشود که توسط Google TPU Research Cloud on Hugging Face ارائه میشود. پشتیبان با پایتون 3، FastAPI و Uvicorn ساخته شده است. پس از ایجاد تصاویر، متن داستان توسط /coqui-ai/TTS پردازش میشود، که روی دستگاهی که توسط Contabo میزبانی میشود، نصب میشود تا یک فایل WAV/MP3 که با طول ویدیو مطابقت دارد تولید کند. همه عناصر با استفاده از MoviePy ترکیب شده و به کاربر بازگردانده می شوند. کاربران از طریق یک نقطه پایانی POST تعامل دارند که درخواستهای یک یا چند کاراکتر را میپذیرد و ویدیوهای تولید شده را که به عنوان فایلهای ثابت ذخیره میشوند، برمیگرداند. یک کار پسزمینه در صورت خرابی یا اگر ویدیوهای قدیمیتر از 30 روز باشند، فضا را خالی میکند. ظاهری که با React Native ساخته شده است، دارای یک رابط کاربری ساده با پخش کننده ویدیو، یک دکمه تولید تصادفی در صفحه اصلی و یک گزینه تولید سفارشی در صفحه ایجاد است که از حداکثر دو کاراکتر یا یک کاراکتر از پیش انتخاب شده از یک لیست پشتیبانی می کند. این برنامه که برای استفاده کودکان یا سرپرستان طراحی شده است، در حال حاضر در مرحله آزمایش است و انتظار می رود به زودی در فروشگاه Play تولید شود.
ساخته شده با
- اندروید
- مینی DALL-E
- ارائه شده توسط Google TPU Research Cloud on Hugging Face.
تیم
توسط
باباستارها
از
ایالات متحده