本頁面由 Cloud Translation API 翻譯而成。

VISION_AI

為視障人士帶來全新的導航體驗。

用途

Vision_AI 是 AI 導覽系統，可根據使用者的周遭環境和需求，提供即時的語音回饋和指示。系統會運用先進的生成式 AI 和電腦視覺技術，擷取及處理環境中的圖像和聲音，提供全面的協助。自動化程序包括即時障礙物偵測和避障功能，以及與穿戴式裝置整合，讓視障人士能安全地獨立行動，同時更輕鬆地取得資訊和服務。技術堆疊：
- **圖像處理的生成式 AI (GEMINI)**
- **HTML/CSS**
- **深度感測 API、語音辨識 API、文字轉語音程式庫**
- **Firebase**
- **使用 ESP32 模組整合盲杖**
- **整合智慧眼鏡**
**我們如何使用 GEMINI API：**
Gemini API 可讓 LiDAR 和相機模組持續串流傳送感應器資料至 AI 處理單元。這樣一來，VISION_AI 就能隨時存取最新的環境資訊，進行即時分析和回應。
透過 Gemini API，VISION_AI 可無縫整合 Google 的生成式 AI，用於物件辨識和場景描述。Gemini API 提供影像處理的必要功能，例如擷取圖片、預先處理和特徵提取。
回饋機制：
VISION_AI 運用 Gemini API 的功能，為使用者提供即時的聽覺和觸覺回饋。

採用

網頁/Chrome
Firebase

團隊

變更者

VISION_AI

寄件者

印度