مرلین

MERLIN: جستجوی ویدیوی مکالمه، متناسب با هدف شما

کاری که انجام می دهد

MERLIN یک پلت فرم جستجوی ویدیویی نوآورانه است که کشف و دسترسی به محتوای ویدیویی را متحول می کند. با ترکیب هوشمندانه تکنیک‌های جاسازی چندوجهی Gemini Flash و Vertex، MERLIN یک تجربه جستجوی ویدیویی یکپارچه و بصری را ارائه می‌کند که دقیقاً مطابق با هدف شما طراحی شده است.

MERLIN در هسته خود، مدل‌های زبان بزرگ و تعبیه‌های چندوجهی پیشرفته را ادغام می‌کند. هنگامی که یک درخواست متنی اولیه را ارسال می کنید، پشتیبان ما تعبیه پرس و جو را استخراج می کند و جستجوی برداری را در برابر جاسازی های ویدیویی از پیش محاسبه شده انجام می دهد. با این حال، اگر نتایج کاملاً به نتیجه نرسید، می‌توانید با MERLIN که توسط Gemini Flash طراحی شده است، در یک گفتگوی طبیعی شرکت کنید.

همانطور که شما صحبت می کنید، MERLIN از Vertex برای استخراج تعبیه های چندوجهی از گفتگو استفاده می کند و زمینه ظریف نیازهای شما را به تصویر می کشد. اینها با جاسازی پرس و جو اولیه درون یابی می شوند و یک جستجوی برداری جدید در برابر پایگاه داده ویدیویی انجام می شود.

در طول این فرآیند، جاسازی‌های برداری و ابرداده‌ها به‌طور یکپارچه در Firestore ذخیره می‌شوند، در حالی که ویدیوها و تصاویر کوچک واقعی در Firebase قرار دارند و تجربه‌ای روان و پاسخگو را تضمین می‌کنند.

MERLIN با استفاده از ترکیب قدرت هوش مصنوعی مکالمه‌ای Gemini Flash و قابلیت‌های چندوجهی Vertex، واقعاً هدف جستجوی ویدیوی شما را مانند قبل درک می‌کند و مرتبط‌ترین و دقیق‌ترین نتایج را نشان می‌دهد.

این پروژه از کار ما MERLIN مشتق شده است: اصلاح چندوجهی تعبیه شده از طریق پیمایش تکراری مبتنی بر LLM برای خط لوله بازیابی متن-ویدئو-بازیابی مجدد.

ساخته شده با

  • وب/کروم
  • Firebase
  • پایتون

تیم

توسط

MERLIN: همراه جستجوی ویدیویی هوشمند شما

از

کره جنوبی