Visibl

Visibl transforme les livres audio en livres vidéo

Description

Visibl est une application iOS qui transforme les livres audio en livres vidéo immersifs, transformant votre expérience d'écoute en voyage visuel. Pendant que vous écoutez, Visibl génère dynamiquement des images en temps réel, ce qui permet aux utilisateurs de voir une interprétation visuelle unique du livre audio qu'ils écoutent. L'application ne crée pas seulement des images statiques. Elle permet aux utilisateurs d'influencer et de guider les visuels, ce qui rend chaque parcours dans un livre hautement personnalisé.

Visibl exploite la puissance de l'API Gemini de trois manières clés:

- Transcription audio: l'application transcrit l'audio du livre audio en texte, ce qui garantit une représentation précise du contenu.

- Reconnaissance d'entités nommées (NER): cette fonctionnalité permet à l'application d'identifier et de se concentrer sur les personnages, les lieux et les objets clés du texte, qui sont essentiels pour générer des visuels pertinents dans le contexte (Gemini 1.5 Pro)

- Génération de requêtes d'image: à l'aide des insights de la transcription et de la reconnaissance d'entités nommées, l'application génère des requêtes d'image détaillées et personnalisées, qui sont ensuite utilisées par les modèles de diffusion pour créer les visuels en temps réel. (Gemini 1.5 Pro)

Cette combinaison de fonctionnalités de l'API Gemini permet à Visibl de proposer non seulement une nouvelle façon d'écouter des livres audio, mais aussi de personnaliser l'expérience en fonction de chaque utilisateur.

Conçu avec

  • Firebase

Équipe

Par

visibl

De

Royaume-Uni