Vismo

Trợ lý video dựa trên AI

Ý nghĩa

Nhóm của chúng tôi đã phát triển một Ứng dụng Trợ lý video thông minh trên YouTube (Vismo) cho phép người dùng nhập URL của video trên YouTube cùng với một câu lệnh hoặc cụm từ tìm kiếm tuỳ chỉnh. Dựa trên ý định của câu lệnh, hệ thống sẽ tận dụng API Gemini để đưa ra câu trả lời phù hợp. Câu trả lời này có thể ở dạng văn bản thuần tuý, văn bản có hình ảnh liên quan, đoạn video từ video được chỉ định hoặc thậm chí là câu trả lời dạng video.

Ứng dụng bắt đầu bằng cách trích xuất phụ đề và tiêu đề của video. Với sự trợ giúp của API Gemini, công cụ này sẽ tạo câu trả lời văn bản, phân loại hình ảnh và đoạn video hoặc tạo kịch bản cho bản tóm tắt video. Ứng dụng sử dụng dấu thời gian và phụ đề trong bản chép lời để xác định và trích xuất chính xác các hình ảnh và đoạn video có liên quan. Ngoài ra, ứng dụng này còn nâng cao trải nghiệm người dùng bằng cách đưa ra các đề xuất như nguồn web, hình ảnh có liên quan và video trên YouTube. API Gemini đóng vai trò quan trọng trong việc tạo cụm từ tìm kiếm thúc đẩy các kết quả web và nội dung đề xuất này.

Được tạo bằng

  • Web/Chrome
  • API Tìm kiếm tuỳ chỉnh JSON của Google
  • API YouTube

Nhóm

Người cập nhật

Maleek, Hamza, Bilal, Affan và Soban

Từ

Pakistan