Gemini 语音助理

通过语音指令使用 Gemini 作为个人助理

作用

这款语音助理由 Gemini AI 赋能,具有本地文本转语音和语音转文字功能,可将语音和文本互动融为一体。Gemini 的 API 擅长理解上下文并针对各种场景调度命令。通过构建上下文并利用 API 集成,Gemini 可以执行 Python 脚本来执行各种功能。
在此应用中,用户可以完全通过语音与 Google 助理互动,从而实现免动手、免看屏幕的操作。因此,在语音是唯一可用的通信方式的情况下,此功能特别有用。该助理的功能包括:

多音箱识别
滤除未知语音噪声
控制智能家居设备
模仿用户的声音
在不同声音和个性之间切换
朗读和总结新闻报道
获取天气和其他信息
播放 Spotify 音乐
拍摄和分析照片
通过 Chrome 浏览链接
安排语音提醒或常规操作

采用 Gemini 技术的助理功能多样且以语音为中心,是一款强大的工具,可用于各种免动手和免看的应用场景,包括车载娱乐、导览、家居管理等。

可采用以下设备打造

  • Web/Chrome

团队

更新者

Zhenya Yang

发件人

澳大利亚