EyeHear는 Gemini API를 사용하여 시각장애인이 초인종 카메라에 액세스할 수 있도록 지원합니다. Gemini는 멀티모달 프롬프트를 사용하여 초인종 동영상의 상세한 텍스트 설명을 생성합니다. 그런 다음 이러한 텍스트 설명은 브라우저에서 자동으로 재생되는 오디오로 변환됩니다. 이를 통해 사용자는 사람, 택배, 기타 이벤트를 식별하는 등 문 앞에 있는 것을 '들을 수' 있습니다. 동영상 설명 메타데이터는 기록 및 가능한 분석 목적으로 Firebase에 저장됩니다.
구성용 제품
웹/Chrome
Firebase
팀
작성자:
ThatOrJohn
From
미국
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["필요한 정보가 없음","missingTheInformationINeed","thumb-down"],["너무 복잡함/단계 수가 너무 많음","tooComplicatedTooManySteps","thumb-down"],["오래됨","outOfDate","thumb-down"],["번역 문제","translationIssue","thumb-down"],["샘플/코드 문제","samplesCodeIssue","thumb-down"],["기타","otherDown","thumb-down"]],[],[],[]]