시각 장애인 지원을 위해 설계된 이 앱은 Gemini API를 통합하여 음성 인식 및 컴퓨터 비전을 통해 실시간으로 설명을 제공합니다. 사용자는 주변 환경이나 캡처된 이미지에 대한 설명을 요청하여 접근성과 안전성을 개선할 수 있습니다. Gemini API는 정확하고 맥락상 관련성 높은 설명을 생성하여 시각 장애가 있는 사용자가 환경을 독립적으로 탐색하고 상호작용할 수 있도록 지원합니다. Gemini API를 사용하여 앱에서 전송된 이미지를 설명하여 시각 장애인에게 위험을 경고하거나 Gemini API를 사용하여 객체와 장소를 식별하도록 도왔습니다.
구성용 제품
Python
팀
작성자:
로잔 사프코타
From
네팔
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["필요한 정보가 없음","missingTheInformationINeed","thumb-down"],["너무 복잡함/단계 수가 너무 많음","tooComplicatedTooManySteps","thumb-down"],["오래됨","outOfDate","thumb-down"],["번역 문제","translationIssue","thumb-down"],["샘플/코드 문제","samplesCodeIssue","thumb-down"],["기타","otherDown","thumb-down"]],[],[],[]]