Dreamy: AI Fairy Tales

AI Fairy Tales: crea storie video per bambini utilizzando le API di Google.

Descrizione

Ho creato un sistema che utilizza Gemini, l'ultimo modello di IA di Google, per generare video fiabe per bambini. Il modello di IA crea i prompt di storie e immagini, che vengono poi trasmessi a Mini DALL-E, basato su Google TPU Research Cloud su Hugging Face. Il backend è realizzato con Python 3, FastAPI e Uvicorn. Una volta create le immagini, il testo della fiaba viene elaborato da /coqui-ai/TTS, installato su una macchina ospitata da Contabo, per generare un file WAV/MP3 corrispondente alla durata del video. Tutti gli elementi vengono combinati utilizzando MoviePy e restituiti all'utente. Gli utenti interagiscono tramite un endpoint POST che accetta richieste di uno o più caratteri e restituisce i video generati, archiviati come file statici. Un processo in background libera spazio in caso di errori o se i video risalgono a più di 30 giorni fa. Il frontend, creato con React Native, presenta un'interfaccia utente semplice con un video player, un pulsante di generazione casuale nella home page e un'opzione di generazione personalizzata nella pagina di creazione, che supporta fino a due caratteri o uno preselezionato da un elenco. L'app, progettata per essere utilizzata da bambini e ragazzi o da supervisori, è attualmente in fase di test e dovrebbe essere presto disponibile in produzione sul Play Store.

Realizzato con

  • Android
  • Mini DALL-E
  • basato su Google TPU Research Cloud su Hugging Face.

Team

Di

Babastars

Da

Stati Uniti