盲人 | Gemini API Developer Competition

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

看過我

用途

我已建構應用程式，協助視障人士在周遭環境中導航，應用程式有 3 種主要模式：「導航模式」可引導使用者瞭解周遭環境、「助理模式」可協助使用者詢問周遭環境的任何特定事物，最後是「閱讀模式」，可協助使用者閱讀書籍或任何標誌牌。
Gemini AI API 已用於專案中的三個檔案，每個檔案都會分配給上述每個模式。
因此，使用者手機的攝影機會擷取即時影格/圖片，然後傳送至 Gemini 輸入方塊，Gemini 會在訓練每個模型後，將提示做為輸出內容，然後輸出提示會顯示在疊加層上，再透過 TTS (文字轉語音) 技術，讓視障人士聽到語音，輕鬆導航。

採用

Android

團隊

變更者

Ahad's 或 Blind Nav

寄件者

巴基斯坦

盲目導航