Ëndrra: Përrallat e AI

AI Fairy Tales: krijon histori video për fëmijët duke përdorur API të Google.

Çfarë bën

Unë kam krijuar një sistem që përdor modelin më të fundit të AI të Google, Gemini, për të gjeneruar video përralla për fëmijë. Modeli i AI krijon kërkesat e historisë dhe imazhit, të cilat më pas kalohen te Mini DALL-E, i mundësuar nga Google TPU Research Cloud on Hugging Face. Backend është ndërtuar me Python 3, FastAPI dhe Uvicorn. Pasi të krijohen imazhet, teksti i përrallës përpunohet nga /coqui-ai/TTS, i instaluar në një makinë të organizuar nga Contabo, për të gjeneruar një skedar WAV/MP3 që përputhet me gjatësinë e videos. Të gjithë elementët kombinohen duke përdorur MoviePy dhe kthehen te përdoruesi. Përdoruesit ndërveprojnë nëpërmjet një pike fundore POST që pranon kërkesa për një ose shumë karaktere dhe kthen videot e krijuara, të cilat ruhen si skedarë statikë. Një punë në sfond hap hapësirën në rast dështimesh ose nëse videot janë më të vjetra se 30 ditë. Pjesa e përparme, e ndërtuar me React Native, përmban një ndërfaqe të thjeshtë me një luajtës video, një buton gjenerimi të rastësishëm në faqen kryesore dhe një opsion gjenerimi të personalizuar në faqen e krijimit, që mbështet deri në dy karaktere ose një të parazgjedhur nga një listë. Aplikacioni, i krijuar për t'u përdorur nga fëmijët ose mbikëqyrësit, është aktualisht në testim dhe pritet të jetë në prodhim së shpejti në Play Store.

E ndertuar me

  • Android
  • Mini DALL-E
  • mundësuar nga Google TPU Research Cloud on Hugging Face.

Ekipi

Nga

Babastars

Nga

Shtetet e Bashkuara