VisionAid
AI의 힘으로 시각장애인이 세상을 탐색하도록 지원
기능
VisionAid는 시각 장애인의 주변 환경 탐색 및 상호작용 능력을 향상시켜 그들의 역량을 강화하도록 설계된 혁신적인 모바일 애플리케이션입니다. 이 앱은 Google의 고급 Gemini 1.5 Flash 모델을 활용하여 이미지를 촬영하고 Gemini로 전송합니다. 이를 통해 사용자는 일상적인 물건을 식별하고, 공공장소를 탐색하고, 익숙한 얼굴과 반려동물을 인식할 수 있어 더욱 연결되고 독립적인 환경을 경험할 수 있습니다.
VisionAid의 직관적인 인터페이스를 통해 사용자는 Gemini Flash 모델과 Google Cloud Text-To-Speech API를 통해 음성 피드백을 통해 즉각적이고 정확한 대답을 얻으며 주변에 관해 쉽게 질문할 수 있습니다. VisionAid는 식료품점에서 상품을 식별하거나, 붐비는 거리를 안전하게 건너거나, 친구를 알아보는 등 사용자의 필요에 따라 세상을 탐색할 수 있도록 지원하는 지능형 동반자 역할을 합니다.
VisionAid는 첨단 기술을 사용하여 시각장애인이 독립적으로 일상생활을 영위할 수 있도록 지원하고 장벽을 허물어 시각장애인이 세상을 더 쉽게 이용할 수 있도록 하는 것을 목표로 합니다. VisionAid는 단순한 앱이 아닙니다. API의 급속한 발전 덕분에 누구나 주변 환경을 선명하고 확실하게 경험할 수 있는 미래를 향한 한 걸음입니다.
구성용 제품
- Google Cloud Text-To-Speech
팀
From
독일