МЕРЛИН

MERLIN: поиск разговорного видео, адаптированный под ваши намерения

Что он делает

MERLIN — это инновационная платформа поиска видео, которая производит революцию в обнаружении и доступе к видеоконтенту. Благодаря гениальному сочетанию методов мультимодального встраивания Gemini Flash и Vertex, MERLIN обеспечивает безупречный и интуитивный поиск видео, точно соответствующий вашим намерениям.

В своей основе MERLIN объединяет большие языковые модели и передовые мультимодальные вложения. Когда вы отправляете начальный текстовый запрос, наш бэкэнд извлекает вложение запроса и выполняет векторный поиск по предварительно вычисленным вложениям видео. Однако, если результаты не совсем соответствуют цели, вы можете вступить в естественный разговор с MERLIN, работающим на Gemini Flash.

По мере того, как вы общаетесь, MERLIN использует Vertex для извлечения мультимодальных вложений из диалога, захватывая нюансный контекст ваших потребностей. Они интерполируются с первоначальным вложением запроса, и новый векторный поиск выполняется по базе данных видео.

В ходе этого процесса векторные вставки и метаданные беспрепятственно сохраняются в Firestore, в то время как сами видео и миниатюры находятся в Firebase, что обеспечивает плавный и адаптивный интерфейс.

Используя объединенную мощь диалогового искусственного интеллекта Gemini Flash и мультимодальных возможностей Vertex, MERLIN по-настоящему понимает ваши цели поиска видео, как никогда ранее, предлагая наиболее релевантные и точные результаты.

Этот проект является производным от нашей работы MERLIN: уточнение мультимодального встраивания с помощью итеративной навигации на основе LLM для конвейера поиска и переранжирования текста и видео.

Построено с

  • Веб/Хром
  • Firebase
  • Питон

Команда

К

MERLIN: Ваш интеллектуальный помощник по поиску видео

От

Южная Корея