Vismo

Assistant vidéo basé sur l'IA

Description

Notre équipe a développé une application d'assistant vidéo YouTube intelligente (Vismo) qui permet aux utilisateurs de saisir une URL de vidéo YouTube ainsi qu'une requête ou une requête personnalisée. En fonction de l'intent de la requête, le système, qui s'appuie sur l'API Gemini, fournit une réponse personnalisée. Cette réponse peut prendre la forme de texte brut, de texte avec des images pertinentes, d'extraits vidéo de la vidéo spécifiée ou même d'une réponse vidéo.

L'application commence par extraire les sous-titres et le titre de la vidéo. Avec l'aide de l'API Gemini, il génère des réponses textuelles, classe des images et des extraits vidéo, ou crée un script pour un résumé vidéo. L'application utilise les codes temporels et les sous-titres de la transcription pour identifier et extraire précisément les images et les segments vidéo pertinents. De plus, l'application améliore l'expérience utilisateur en proposant des recommandations telles que des sources Web, des images associées et des vidéos YouTube. L'API Gemini joue un rôle crucial dans la génération des requêtes de recherche qui alimentent ces résultats Web et ces recommandations.

Conçu avec

  • Web/Chrome
  • API JSON Google Custom Search
  • API YouTube

Équipe

Par

Maleek, Hamza, Bilal, Affan et Soban

De

Pakistan