Vision Crafters
通过 Gemini 提供的描述,安全地探索世界。
作用
目标:
我们的移动应用可帮助视障人士更好地了解周围环境,从而赋予他们力量。该应用使用设备的摄像头拍摄图片或视频,并通过 Gemini API 对其进行处理,以生成描述性文本,然后将其转换为语音。该应用还提供用于拍照/录像的手势控制功能,并集成了危险检测功能,以便在危险情况下发出警报。
Gemini 集成:
Gemini 是我们应用不可或缺的一部分,可提供先进的场景转文字处理功能。它可以将图片和视频中的视觉数据转换为准确、详细的文本说明。Gemini 擅长识别复杂场景和发现潜在危险,可为用户提供准确且切实可行的反馈。此功能对于打造方便易用且信息丰富的体验至关重要,因此 Gemini 对文本说明和危险检测至关重要。此外,Gemini 还用于为互动日志生成标题。
功能:
- 使用 Gemini 进行场景转文字处理。
- 为实现无障碍功能,提供文本转语音、语音转文字和手势控制。
- 使用 Gemini 进行危险检测并发出提醒。
- 互动日志包含 Gemini 生成的标题。
最终用户:
专为视障人士及其护理人员设计。
优势:
- 通过音频更好地了解周围环境。
- 借助危险提醒提高安全性。
- 提高独立性并轻松访问日志。
可采用以下设备打造
- Flutter
- Firebase
团队
更新者
Vision Crafters
发件人
印度