VISION_AI

为视障人士彻底改变导航体验。

作用

Vision_AI 是一款 AI 导航系统,旨在根据盲人的周围环境和需求,为其提供实时音频反馈和指令。该系统利用先进的生成式 AI 和计算机视觉技术,捕获并处理环境中的图像和声音,以提供全面的帮助。自动化流程包括实时障碍物检测和避障,以及与穿戴式设备的集成,让盲人能够独立安全地出行,同时更轻松地获取信息和服务。技术栈:
- **用于图像处理的生成式 AI (GEMINI)**
- **HTML/CSS**
- **深度感知 API、语音识别 API、文本转语音库**
- **Firebase**
- **使用 ESP32 模块集成的盲杖**
- **与智能眼镜集成**
**我们如何使用 GEMINI API:**
Gemini API 支持将传感器数据从激光雷达和摄像头模块持续流式传输到 AI 处理单元。这样可确保 VISION_AI 始终能够访问最新的环境信息,从而进行实时分析和响应。
通过 Gemini API,VISION_AI 可无缝集成 Google 的生成式 AI 来实现物体识别和场景描述。Gemini API 提供图片处理的基本功能,例如图片拍摄、预处理和特征提取
反馈机制:
VISION_AI 利用 Gemini API 的功能,可向用户提供即时的听觉和触觉反馈。

可采用以下设备打造

  • Web/Chrome
  • Firebase

团队

更新者

VISION_AI

发件人

印度