TwilightNav
Помогите людям с нарушениями зрения ориентироваться в Интернете.
Что он делает
Приложение использует API Gemini для улучшения взаимодействия с пользователем с помощью двух ключевых функций:
Анализ и структурирование контента: API Gemini анализирует HTML-формат веб-страницы, преобразуя его в иерархическую древовидную структуру. В этой структуре каждый узел представляет собой определенный элемент контента, содержащий как описание этого элемента, так и сводку его дочерних элементов. Такая организация обеспечивает эффективную обработку и понимание контента веб-страницы.
Распознавание намерений и навигация: API Gemini также играет важную роль в понимании пользовательских инструкций. Он обрабатывает голосовой ввод для определения намерений пользователя и идентифицирует соответствующий целевой узел в древовидной структуре. API классифицирует пользовательские команды по шести намерениям: переход на веб-сайт, резюмирование, чтение контента, запрос информации, нажатие элементов и заполнение форм.
Используя эти возможности, приложение позволяет пользователям выполнять различные веб-задачи с помощью голосовых команд и жестов, делая процесс просмотра более доступным и интуитивно понятным.
Построено с
- андроид
Команда
К
TwilightNav
От
Австралия