Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Vismo

KI-basierter Videoassistent

Funktion

Unser Team hat eine Smart YouTube Video Assistant Application (Vismo) entwickelt, mit der Nutzer eine YouTube-Video-URL zusammen mit einem benutzerdefinierten Prompt oder einer benutzerdefinierten Suchanfrage eingeben können. Basierend auf der Absicht des Prompts liefert das System mithilfe der Gemini API eine individuelle Antwort. Diese Antwort kann in Form von Nur-Text, Text mit relevanten Bildern, Video-Snippets aus dem angegebenen Video oder sogar einer Videoantwort vorliegen.

Zuerst werden die Untertitel und der Titel des Videos extrahiert. Mithilfe der Gemini API generiert es Textantworten, klassifiziert Bilder und Video-Snippets oder erstellt ein Script für eine Videozusammenfassung. Die App verwendet Zeitstempel und Untertitel aus dem Transkript, um relevante Bilder und Videosegmente genau zu identifizieren und zu extrahieren. Außerdem bietet die Anwendung Empfehlungen wie Webquellen, ähnliche Bilder und YouTube-Videos, um die Nutzerfreundlichkeit zu verbessern. Die Gemini API spielt eine wichtige Rolle bei der Generierung der Suchanfragen, die diese Webergebnisse und Empfehlungen liefern.

Basis

Web/Chrome
Google Custom Search JSON API
YouTube API

Team

Von

Maleek, Hamza, Bilal, Affan und Soban

Von

Pakistan