مرلین
MERLIN: جستجوی ویدیوی مکالمه، متناسب با هدف شما
کاری که انجام می دهد
MERLIN یک پلت فرم جستجوی ویدیویی نوآورانه است که کشف و دسترسی به محتوای ویدیویی را متحول می کند. با ترکیب هوشمندانه تکنیکهای جاسازی چندوجهی Gemini Flash و Vertex، MERLIN یک تجربه جستجوی ویدیویی یکپارچه و بصری را ارائه میکند که دقیقاً مطابق با هدف شما طراحی شده است.
MERLIN در هسته خود، مدلهای زبان بزرگ و تعبیههای چندوجهی پیشرفته را ادغام میکند. هنگامی که یک درخواست متنی اولیه را ارسال می کنید، پشتیبان ما تعبیه پرس و جو را استخراج می کند و جستجوی برداری را در برابر جاسازی های ویدیویی از پیش محاسبه شده انجام می دهد. با این حال، اگر نتایج کاملاً به نتیجه نرسید، میتوانید با MERLIN که توسط Gemini Flash طراحی شده است، در یک گفتگوی طبیعی شرکت کنید.
همانطور که شما صحبت می کنید، MERLIN از Vertex برای استخراج تعبیه های چندوجهی از گفتگو استفاده می کند و زمینه ظریف نیازهای شما را به تصویر می کشد. اینها با جاسازی پرس و جو اولیه درون یابی می شوند و یک جستجوی برداری جدید در برابر پایگاه داده ویدیویی انجام می شود.
در طول این فرآیند، جاسازیهای برداری و ابردادهها بهطور یکپارچه در Firestore ذخیره میشوند، در حالی که ویدیوها و تصاویر کوچک واقعی در Firebase قرار دارند و تجربهای روان و پاسخگو را تضمین میکنند.
MERLIN با استفاده از ترکیب قدرت هوش مصنوعی مکالمهای Gemini Flash و قابلیتهای چندوجهی Vertex، واقعاً هدف جستجوی ویدیوی شما را مانند قبل درک میکند و مرتبطترین و دقیقترین نتایج را نشان میدهد.
این پروژه از کار ما MERLIN مشتق شده است: اصلاح چندوجهی تعبیه شده از طریق پیمایش تکراری مبتنی بر LLM برای خط لوله بازیابی متن-ویدئو-بازیابی مجدد.
ساخته شده با
- وب/کروم
- Firebase
- پایتون
تیم
توسط
MERLIN: همراه جستجوی ویدیویی هوشمند شما
از
کره جنوبی