Cognitive Strike

Gemini 增强型视频通话,让您在各种场景下都能游刃有余

作用

该应用旨在通过使用 Gemini 彻底改变为各种场景做好准备的方式。我们设计了此功能,以模拟逼真的视频互动。我们对系统角色进行了微调,使其能够根据具体用户需求提供个性化的模拟练习,帮助用户为面试做好准备。

该应用提供两种动态模式:聊天模式和视频模式。在 Chat 模式下,用户与个性化的 Gemini 面试官互动,然后参加根据该特定对话生成的个性化知识问答。视频模式会使用 Google Cloud TTS 和 webSTT 模拟与用户进行实时视频通话。此模型会异步上传用户的视频 Feed,并根据模型看到的内容和用户所说的内容,通过 Gemini 生成动态回答。

附注 - 此处使用的唯一 LLM API 是 Gemini。另一个 API 是 Google Cloud Text-to-Speech。

可采用以下设备打造

  • Chromium 和 Google Cloud Text-to-Speech

团队

更新者

Automa

发件人

印度