Vision 設計師

透過 Gemini 提供的描述,安全地探索世界。

用途

目標:
我們的行動應用程式可協助視障人士瞭解周遭環境。應用程式會使用裝置的相機拍攝圖片或影片,並透過 Gemini API 處理這些內容,產生描述性文字,然後轉換為語音。應用程式也提供手勢控制功能,可用於拍照/錄影,並整合危險偵測功能,在危險情況下發出警報。

Gemini 整合:
Gemini 是應用程式的必要元素,可提供進階的場景轉文字處理功能。將圖片和影片中的視覺資料轉譯為準確且詳細的文字說明。Gemini 擅長辨識複雜場景和潛在危險,並為使用者提供精確且實用的意見回饋。這項功能對於打造無障礙且實用的體驗至關重要,因此 Gemini 在文字說明和危險偵測方面都扮演著重要角色。此外,Gemini 可用於產生互動記錄的標題。

功能:
- 使用 Gemini 進行場景轉文字處理。
- 使用文字轉語音、語音轉文字和手勢控制項,以利無障礙存取。
- 使用 Gemini 偵測危險並發出警報。
- 互動記錄會產生 Gemini 產生的標題。

使用者:
專為視障人士和照護者設計。

優點:
- 透過音訊更瞭解周遭環境。
- 透過危險警報提升安全性。
- 使用者可更獨立操作,輕鬆存取記錄。

採用

  • Flutter
  • Firebase

團隊

變更者

Vision 設計師

寄件者

印度