Dreamy: Contes de fées avec IA

Contes de fées avec l'IA: crée des histoires vidéo pour les enfants à l'aide des API Google.

Description

J'ai créé un système qui utilise le dernier modèle d'IA de Google, Gemini, pour générer des histoires vidéo pour les enfants. Le modèle d'IA crée les invites d'histoire et d'image, qui sont ensuite transmises à Mini DALL-E, optimisé par Google TPU Research Cloud sur Hugging Face. Le backend est créé avec Python 3, FastAPI et Uvicorn. Une fois les images créées, le texte du conte est traité par /coqui-ai/TTS, installé sur une machine hébergée par Contabo, pour générer un fichier WAV/MP3 correspondant à la durée de la vidéo. Tous les éléments sont combinés à l'aide de MoviePy et renvoyés à l'utilisateur. Les utilisateurs interagissent via un point de terminaison POST qui accepte les requêtes d'un ou de plusieurs caractères et renvoie les vidéos générées, qui sont stockées en tant que fichiers statiques. Une tâche en arrière-plan libère de l'espace en cas d'échec ou si les vidéos datent de plus de 30 jours. Le frontend, créé avec React Native, présente une UI simple avec un lecteur vidéo, un bouton de génération aléatoire sur la page d'accueil et une option de génération personnalisée sur la page de création, qui accepte jusqu'à deux caractères ou un présélectionné dans une liste. L'application, conçue pour être utilisée par des enfants ou des superviseurs, est actuellement en cours de test et devrait bientôt être disponible en production sur le Play Store.

Conçu avec

  • Android
  • Mini DALL-E
  • basé sur Google TPU Research Cloud sur Hugging Face

Équipe

Par

Babastars

De

États-Unis