اعتصاب شناختی

تماس ویدیویی پیشرفته Gemini، مهارت های خود را برای هر سناریویی کامل کنید

کاری که انجام می دهد

هدف این برنامه ایجاد انقلابی در آمادگی برای سناریوهای مختلف با استفاده از Gemini است. ما آن را برای شبیه سازی تعاملات ویدئویی واقعی طراحی کردیم. ما نقش سیستم را طوری تنظیم کردیم که با تطبیق با نیازهای خاص کاربر و کمک به آنها برای آماده شدن برای مصاحبه، جلسات ساختگی شخصی سازی شده را ارائه دهد.

این برنامه دارای دو حالت پویا است: حالت های چت و ویدیو. در حالت چت، کاربران با یک مصاحبه‌گر شخصی‌شده Gemini درگیر می‌شوند و سپس آزمون‌های شخصی‌سازی‌شده ایجاد شده در آن مکالمه خاص را انجام می‌دهند. حالت ویدیو یک تماس ویدیویی زنده را با کاربر با استفاده از Google Cloud TTS و webSTT شبیه‌سازی می‌کند. این مدل به طور ناهمزمان فید ویدیوی کاربر را آپلود می کند و بر اساس آنچه مدل می بیند و آنچه کاربر صحبت می کند، پاسخ پویا از Gemini ایجاد می کند.

PS - تنها API LLM مورد استفاده در اینجا Gemini است. API دیگر Google Cloud Text-to-Speech است.

ساخته شده با

  • Chromium و Google Cloud Text to Speech

تیم

توسط

خودکار

از

هند