Эта страница переведена с помощью Cloud Translation API.

ВИДЕНИЕ_ИИ

Революционная навигация для людей с нарушениями зрения.

Что он делает

Vision_AI — это система наведения на основе ИИ, разработанная для предоставления слепым людям аудиообратной связи в реальном времени и инструкций на основе их окружения и потребностей. Используя передовой генеративный ИИ и компьютерное зрение, система захватывает и обрабатывает изображения и звуки из окружающей среды, чтобы предложить всестороннюю помощь. Автоматизированный процесс включает обнаружение и избегание препятствий в реальном времени и интеграцию с носимыми устройствами, что позволяет слепым людям путешествовать самостоятельно и безопасно, а также получать доступ к информации и услугам более легко. Технологический стек:
- **Генеративный ИИ (GEMINI) ДЛЯ ОБРАБОТКИ ИЗОБРАЖЕНИЙ**
- **HTML/CSS**
- **API определения глубины, API распознавания речи, библиотеки преобразования текста в речь**
- **Огненная база**
- **Слепая интеграция Stick с использованием модуля ESP32**
- **Интеграция с умными очками**
**КАК МЫ ИСПОЛЬЗОВАЛИ API GEMINI:**
API Gemini обеспечивает непрерывную потоковую передачу данных датчиков от модулей LiDAR и камер в блок обработки AI. Это гарантирует, что VISION_AI всегда имеет доступ к последней информации об окружающей среде, что позволяет проводить анализ и реагировать в режиме реального времени.
Через Gemini API VISION_AI бесшовно интегрирует генеративный ИИ Google для распознавания объектов и описания сцен. Gemini API предоставляет основные функции для обработки изображений, такие как захват изображения, предварительная обработка и извлечение признаков
Механизмы обратной связи:
Используя возможности API Gemini, VISION_AI обеспечивает мгновенную слуховую и тактильную обратную связь с пользователем.

Построено с

Веб/Хром
Firebase

Команда

ВИДЕНИЕ_ИИ

От

Индия