VISION_AI
為視障人士帶來全新的導航體驗。
用途
Vision_AI 是 AI 導覽系統,旨在根據使用者周遭環境和需求,為視障人士提供即時的語音回饋和指示。系統會運用先進的生成式 AI 和電腦視覺技術,擷取及處理環境中的圖像和聲音,提供全面的協助。自動化程序包括即時障礙物偵測和避障功能,以及與穿戴式裝置整合,讓視障人士能安全地獨立出行,同時更輕鬆地取得資訊和服務。技術堆疊:
- **用於圖像處理的生成式 AI (GEMINI)**
- **HTML/CSS**
- **深度感測 API、語音辨識 API、文字轉語音程式庫**
- **Firebase**
- **使用 ESP32 模組整合盲杖**
- **與智慧眼鏡整合**
**我們如何使用 GEMINI API:**
Gemini API 可讓 LiDAR 和相機模組持續串流傳送感應器資料到 AI 處理單元。這樣一來,VISION_AI 就能隨時存取最新的環境資訊,進行即時分析及回應。
透過 Gemini API,VISION_AI 可無縫整合 Google 的生成式 AI,用於物件辨識和場景描述。Gemini API 提供影像處理的必要功能,例如擷取圖片、預先處理和特徵提取。
回饋機制:
VISION_AI 會運用 Gemini API 的功能,為使用者提供即時的聽覺和觸覺回饋。
採用
- 網頁/Chrome
- Firebase
團隊
變更者
VISION_AI
寄件者
印度