VisionAid

運用 AI 技術協助視障人士探索世界。

用途

VisionAid 是一款創新的行動應用程式,旨在協助視障人士克服障礙,提升他們在周遭環境中導航和互動的能力。應用程式會利用 Google 的進階 Gemini 1.5 Flash 模型拍攝圖片並傳送至 Gemini,讓使用者能夠辨識日常物品、在公共場所導航,甚至辨識熟悉的面孔和寵物,打造更連結、更獨立的體驗。

VisionAid 的直覺介面可讓使用者輕鬆詢問周遭環境相關問題,並透過語音回饋即時取得準確的回覆,這要歸功於 Gemini Flash 模型和 Google Cloud 文字轉語音 API。無論是辨識雜貨店中的商品、安全地穿越繁忙的街道,或是辨識朋友,VisionAid 都能扮演智慧型隨行助理,讓使用者能安心探索世界。

VisionAid 旨在打破障礙,讓視障人士更容易融入世界,並運用尖端科技協助他們獨立生活,改善日常生活。VisionAid 不只是一款應用程式,更是朝向未來邁進的一步,讓所有人都能透過 API 的快速進步,清楚且自信地體驗周遭環境。

採用

  • Google Cloud Text-To-Speech

團隊

寄件者

德國