Революционная навигация для людей с нарушениями зрения.
Что он делает
Vision_AI — это система наведения на основе ИИ, разработанная для предоставления слепым людям аудиообратной связи в реальном времени и инструкций на основе их окружения и потребностей. Используя передовой генеративный ИИ и компьютерное зрение, система захватывает и обрабатывает изображения и звуки из окружающей среды, чтобы предложить всестороннюю помощь. Автоматизированный процесс включает обнаружение и избегание препятствий в реальном времени и интеграцию с носимыми устройствами, что позволяет слепым людям путешествовать самостоятельно и безопасно, а также получать доступ к информации и услугам более легко. Технологический стек: - **Генеративный ИИ (GEMINI) ДЛЯ ОБРАБОТКИ ИЗОБРАЖЕНИЙ** - **HTML/CSS** - **API определения глубины, API распознавания речи, библиотеки преобразования текста в речь** - **Огненная база** - **Слепая интеграция Stick с использованием модуля ESP32** - **Интеграция с умными очками** **КАК МЫ ИСПОЛЬЗОВАЛИ API GEMINI:** API Gemini обеспечивает непрерывную потоковую передачу данных датчиков от модулей LiDAR и камер в блок обработки AI. Это гарантирует, что VISION_AI всегда имеет доступ к последней информации об окружающей среде, что позволяет проводить анализ и реагировать в режиме реального времени. Через Gemini API VISION_AI бесшовно интегрирует генеративный ИИ Google для распознавания объектов и описания сцен. Gemini API предоставляет основные функции для обработки изображений, такие как захват изображения, предварительная обработка и извлечение признаков Механизмы обратной связи: Используя возможности API Gemini, VISION_AI обеспечивает мгновенную слуховую и тактильную обратную связь с пользователем.
Построено с
Веб/Хром
Firebase
Команда
К
ВИДЕНИЕ_ИИ
От
Индия
[[["Прост для понимания","easyToUnderstand","thumb-up"],["Помог мне решить мою проблему","solvedMyProblem","thumb-up"],["Другое","otherUp","thumb-up"]],[["Отсутствует нужная мне информация","missingTheInformationINeed","thumb-down"],["Слишком сложен/слишком много шагов","tooComplicatedTooManySteps","thumb-down"],["Устарел","outOfDate","thumb-down"],["Проблема с переводом текста","translationIssue","thumb-down"],["Проблемы образцов/кода","samplesCodeIssue","thumb-down"],["Другое","otherDown","thumb-down"]],[],[],[],null,["# VISION_AI\n\n[More Apps](/competition/vote) \n\nVISION_AI\n=========\n\nRevolutionizing navigation for the visually impaired. \nVote \nVoted!\nWhat it does\n\nVision_AI is an AI guidance system designed to provide blind individuals with real-time audio feedback and instructions based on their surroundings and needs. Utilizing cutting-edge generative AI and computer vision, the system captures and processes images and sounds from the environment to offer comprehensive assistance. The automated process includes Real-Time Obstacle Detection and Avoidance, and Integration with Wearable Devices, enabling blind people to travel independently and safely while accessing information and services more easily. Technology Stack: \n- \\*\\*Generative AI (GEMINI) FOR IMAGE PROCESSING\\*\\* \n- \\*\\*HTML/CSS\\*\\* \n- \\*\\*Depth Sensing API, Speech Recognition APIs, Text-to-Speech Libraries\\*\\* \n- \\*\\*Firebase\\*\\* \n- \\*\\*Blind Stick Integration using ESP32 Module\\*\\* \n- \\*\\*Integration with Smart Glasses\\*\\* \n\\*\\*HOW WE USED GEMINI API:\\*\\* \nThe Gemini API enables continuous streaming of sensor data from the LiDAR and camera modules to the AI processing unit. This ensures that VISION_AI always has access to the latest environmental information, allowing for real-time analysis and response. \nThrough the Gemini API, VISION_AI seamlessly integrates Google's Generative AI for object recognition and scene description. The Gemini API provides essential functionalities for image processing, such as image capture, preprocessing, and feature extraction \nFeedback Mechanisms: \nLeveraging the capabilities of the Gemini API, VISION_AI delivers instantaneous auditory and tactile feedback to the user. \nBuilt with\n\n- Web/Chrome\n- Firebase \nTeam \nBy\n\nVISION_AI \nFrom\n\nIndia \n[](/competition/vote)"]]