VISION_AI
Revoluciona la navegación para personas con discapacidad visual.
Qué hace
Vision_AI es un sistema de orientación de IA diseñado para proporcionar a las personas ciegas instrucciones y comentarios de audio en tiempo real en función de su entorno y sus necesidades. Con IA generativa y visión artificial de vanguardia, el sistema captura y procesa imágenes y sonidos del entorno para ofrecer asistencia integral. El proceso automatizado incluye la detección y evitación de obstáculos en tiempo real, y la integración con dispositivos wearables, lo que permite que las personas ciegas viajen de forma independiente y segura mientras acceden a información y servicios con mayor facilidad. Pila de tecnología:
- **IA generativa (GEMINI) PARA EL PROCESAMIENTO DE IMÁGENES**
- **HTML/CSS**
- **API de Depth Sensing, APIs de reconocimiento de voz, bibliotecas de texto a voz**
- **Firebase**
- **Integración de Blind Stick con el módulo ESP32**
- **Integración con gafas inteligentes**
**CÓMO USAMOS LA API DE GEMINI:**
La API de Gemini permite la transmisión continua de datos de sensores desde los módulos LiDAR y de la cámara a la unidad de procesamiento de IA. Esto garantiza que VISION_AI siempre tenga acceso a la información ambiental más reciente, lo que permite el análisis y la respuesta en tiempo real.
A través de la API de Gemini, VISION_AI integra sin problemas la IA generativa de Google para el reconocimiento de objetos y la descripción de escenas. La API de Gemini proporciona funciones esenciales para el procesamiento de imágenes, como la captura de imágenes, el procesamiento previo y la extracción de características.
Mecanismos de comentarios:
Mediante las capacidades de la API de Gemini, VISION_AI le brinda al usuario comentarios táctiles y auditivos instantáneos.
Con la tecnología de
- Web/Chrome
- Firebase
Equipo
De
VISION_AI
De
India