Vismo
KI-basierter Videoassistent
Funktion
Unser Team hat eine Smart YouTube Video Assistant Application (Vismo) entwickelt, mit der Nutzer eine YouTube-Video-URL zusammen mit einem benutzerdefinierten Prompt oder einer benutzerdefinierten Suchanfrage eingeben können. Basierend auf der Absicht des Prompts liefert das System mithilfe der Gemini API eine individuelle Antwort. Diese Antwort kann in Form von Nur-Text, Text mit relevanten Bildern, Video-Snippets aus dem angegebenen Video oder sogar einer Videoantwort vorliegen.
Zuerst werden die Untertitel und der Titel des Videos extrahiert. Mithilfe der Gemini API generiert es Textantworten, klassifiziert Bilder und Video-Snippets oder erstellt ein Script für eine Videozusammenfassung. Die App verwendet Zeitstempel und Untertitel aus dem Transkript, um relevante Bilder und Videosegmente genau zu identifizieren und zu extrahieren. Außerdem bietet die Anwendung Empfehlungen wie Webquellen, ähnliche Bilder und YouTube-Videos, um die Nutzerfreundlichkeit zu verbessern. Die Gemini API spielt eine wichtige Rolle bei der Generierung der Suchanfragen, die diese Webergebnisse und Empfehlungen liefern.
Basis
- Web/Chrome
- Google Custom Search JSON API
- YouTube API
Team
Von
Maleek, Hamza, Bilal, Affan und Soban
Von
Pakistan