TwilightNav

Помогите людям с нарушениями зрения ориентироваться в Интернете.

Что он делает

Приложение использует API Gemini для улучшения взаимодействия с пользователем с помощью двух ключевых функций:

Анализ и структурирование контента: API Gemini анализирует HTML-формат веб-страницы, преобразуя его в иерархическую древовидную структуру. В этой структуре каждый узел представляет собой определенный элемент контента, содержащий как описание этого элемента, так и сводку его дочерних элементов. Такая организация обеспечивает эффективную обработку и понимание контента веб-страницы.

Распознавание намерений и навигация: API Gemini также играет важную роль в понимании пользовательских инструкций. Он обрабатывает голосовой ввод для определения намерений пользователя и идентифицирует соответствующий целевой узел в древовидной структуре. API классифицирует пользовательские команды по шести намерениям: переход на веб-сайт, резюмирование, чтение контента, запрос информации, нажатие элементов и заполнение форм.

Используя эти возможности, приложение позволяет пользователям выполнять различные веб-задачи с помощью голосовых команд и жестов, делая процесс просмотра более доступным и интуитивно понятным.

Построено с

  • андроид

Команда

К

TwilightNav

От

Австралия