此页面由 Cloud Translation API 翻译。

VISION_AI

为视障人士彻底改变导航体验。

作用

Vision_AI 是一款 AI 导航系统，旨在根据盲人的周围环境和需求，为其提供实时音频反馈和指令。该系统利用先进的生成式 AI 和计算机视觉技术，捕获并处理环境中的图像和声音，从而提供全面的帮助。自动化流程包括实时障碍物检测和避障，以及与穿戴式设备的集成，让盲人能够独立安全地出行，同时更轻松地获取信息和服务。技术栈：
- **用于图像处理的生成式 AI (GEMINI)**
- **HTML/CSS**
- **深度感知 API、语音识别 API、文本转语音库**
- **Firebase**
- **使用 ESP32 模块集成盲杖**
- **与智能眼镜集成**
**我们如何使用 GEMINI API：**
Gemini API 支持将传感器数据从激光雷达和摄像头模块持续流式传输到 AI 处理单元。这样可确保 VISION_AI 始终能够访问最新的环境信息，从而进行实时分析和响应。
通过 Gemini API，VISION_AI 可无缝集成 Google 的生成式 AI 来实现物体识别和场景描述。Gemini API 提供图片处理的基本功能，例如图片拍摄、预处理和特征提取
反馈机制：
利用 Gemini API 的功能，VISION_AI 可向用户提供即时的听觉和触觉反馈。

可采用以下设备打造

Web/Chrome
Firebase

团队

更新者

VISION_AI

发件人

印度