Anuj Sharma

能够看世界的语音助理

作用

我喜欢 Google (Gemini) 的 API,因为它能提供丰富的结果,我想借助 Gemini API 来完成我的小项目,因此
我开发了一个 Python 应用或软件,旨在打造一个独特的 AI 或语音助理。目前,有很多代码或项目中,语音助理会以语音形式接受指令并以语音形式返回结果,但它们无法以视觉形式查看我们的询问,因此我借助 Gemini API (Pro 和 Vision Pro) 开发了此类项目,现在我的语音助理还能够以图片的形式获取输入,并以文本和语音形式回复我的回答

可采用以下设备打造

  • Firebase

团队

更新者

Kritrim

发件人

印度