Vismo

Asistente de video basado en IA

Qué hace

Nuestro equipo desarrolló una aplicación de Smart YouTube Video Assistant (Vismo) que permite a los usuarios ingresar una URL de video de YouTube junto con una instrucción o consulta personalizada. En función del intent de la instrucción, el sistema, aprovechando la API de Gemini, proporciona una respuesta personalizada. Esta respuesta puede ser de texto sin formato, texto con imágenes relevantes, fragmentos de video del video especificado o incluso una respuesta de video.

La aplicación comienza por extraer los subtítulos y el título del video. Con la ayuda de la API de Gemini, genera respuestas de texto, clasifica imágenes y fragmentos de video, o crea un guion para un resumen de video. La app usa marcas de tiempo y subtítulos de la transcripción para identificar y extraer con precisión imágenes y segmentos de video relevantes. Además, la aplicación mejora la experiencia del usuario, ya que ofrece recomendaciones, como fuentes web, imágenes relacionadas y videos de YouTube. La API de Gemini desempeña un papel fundamental en la generación de las búsquedas que alimentan estos resultados y recomendaciones web.

Con la tecnología de

  • Web/Chrome
  • API de JSON de la Búsqueda personalizada de Google
  • API de YouTube

Equipo

De

Maleek, Hamza, Bilal, Affan y Soban

De

Pakistán