Vision Crafters
Gemini 기반 설명을 통해 안전하게 세상을 탐색하세요.
기능
목표:
이 모바일 앱은 시각장애인이 주변 환경을 더 잘 이해할 수 있도록 지원합니다. 앱은 기기의 카메라를 사용하여 이미지 또는 동영상을 캡처하고 Gemini API를 통해 이를 처리하여 설명 텍스트를 생성한 후 음성으로 변환합니다. 또한 이 앱에는 사진/동영상 캡처를 위한 동작 제어가 있으며 위험 감지를 통합하여 위험한 상황에서 알람을 울립니다.
Gemini 통합:
Gemini는 앱에 통합되어 고급 장면-텍스트 처리 기능을 제공합니다. 이미지와 동영상의 시각적 데이터를 정확하고 상세한 텍스트 설명으로 변환합니다. Gemini는 복잡한 장면을 인식하고 잠재적인 위험을 식별하는 데 탁월하여 사용자에게 정확하고 실행 가능한 피드백을 제공합니다. 이 기능은 접근성이 높고 유용한 환경을 만드는 데 중요한 역할을 하며, Gemini는 텍스트 설명과 위험 감지 모두에 필수적입니다. 또한 Gemini는 상호작용 로그의 제목을 생성하는 데 사용됩니다.
기능:
-Gemini를 통한 장면-텍스트 처리.
-접근성을 위한 텍스트 음성 변환, 음성 텍스트 변환, 동작 제어.
-Gemini를 통한 위험 감지 및 알림.
-Gemini에서 생성한 제목이 포함된 상호작용 로그.
최종 사용자:
시각 장애인 및 보호자를 위해 설계되었습니다.
이점:
-오디오를 통해 주변 환경을 더 잘 이해할 수 있습니다.
-위험 알림으로 안전이 향상됩니다.
-독립성이 향상되고 로그에 쉽게 액세스할 수 있습니다.
구성용 제품
- Flutter
- Firebase
팀
작성자:
Vision Crafters
From
인도