TwilightNav

시각장애인이 인터넷을 탐색할 수 있도록 지원하세요.

기능

이 앱은 Gemini API를 사용하여 두 가지 주요 기능을 통해 사용자 상호작용을 개선합니다.

콘텐츠 분석 및 구조화: Gemini API는 웹페이지의 HTML 형식을 분석하여 계층적 트리 구조로 변환합니다. 이 구조에서 각 노드는 특정 콘텐츠 요소를 나타내며 해당 요소에 대한 설명과 하위 요소의 요약을 모두 포함합니다. 이러한 구성을 통해 웹페이지 콘텐츠를 효율적으로 처리하고 이해할 수 있습니다.

의도 인식 및 탐색: Gemini API는 사용자 안내를 이해하는 데도 중요한 역할을 합니다. 음성 입력을 처리하여 사용자의 인텐트를 감지하고 트리 구조 내에서 상응하는 타겟 노드를 식별합니다. 이 API는 사용자 명령을 웹사이트로 이동, 요약, 콘텐츠 읽기, 정보 쿼리, 요소 클릭, 양식 작성 등 6가지 인텐트로 분류합니다.

이러한 기능을 활용하면 앱에서 사용자가 음성 명령과 동작을 통해 다양한 웹 기반 작업을 실행할 수 있으므로 탐색 환경을 더 쉽게 이용하고 직관적으로 사용할 수 있습니다.

구성용 제품

  • Android

작성자:

TwilightNav

From

오스트레일리아