Pixtale
Créez des vidéos commentées en quelques minutes à partir de photos de vos voyages grâce à la magie de l'IA de Gemini.
Description
Pixtale est une application basée sur l'IA qui transforme les photos et vidéos de vos voyages en histoires vidéo commentées. Voici comment procéder:
1. Importation: les utilisateurs importent un fichier ZIP contenant des contenus multimédias de leur voyage ou sélectionnent un album Google Photos.
2. Extraction de métadonnées: l'application extrait la date, l'heure et les données GPS des contenus multimédias.
3. Génération de descriptions par IA: c'est là que l'API Gemini excelle:
- Gemini Flash génère des descriptions pour des photos et des vidéos individuelles.
- Gemini 1.5 Pro utilise ces descriptions comme entrée et crée un script narratif cohérent, scène par scène.
4. Narration audio: l'API Text-to-Speech de Google convertit le script en audio.
5. Création de la vidéo: FFmpeg combine la narration avec le contenu multimédia d'origine pour créer la vidéo finale.
6. Contenu pour les réseaux sociaux: Pixtale va plus loin en générant:
- Des légendes et des hashtags à partager
- Un mini-post de blog récapitulatif du voyage (également à l'aide de Gemini 1.5 Pro)
7. Personnalisation par l'utilisateur: les utilisateurs peuvent modifier les informations de localisation de chaque scène à l'aide de l'API Google Maps.
Pixtale exploite la capacité de Gemini à interpréter les données visuelles, à comprendre le contexte, à générer du contenu cohérent et engageant, et à créer des récits personnels et authentiques. Cette approche basée sur l'IA permet de créer rapidement des histoires de voyage multimédias riches qui seraient longues à produire manuellement.
Conçu avec
- API Library de Google Photos
- API Google Maps
Équipe
Par
Pixtale
De
États-Unis