VISION_AI

Rivoluziona la navigazione per le persone ipovedenti.

Descrizione

Vision_AI è un sistema di guida IA progettato per fornire a persone cieche feedback e istruzioni audio in tempo reale in base al loro ambiente e alle loro esigenze. Utilizzando l'IA generativa e la visione artificiale all'avanguardia, il sistema acquisisce ed elabora immagini e suoni dell'ambiente per offrire assistenza completa. Il processo automatizzato include il rilevamento e l'evitamento di ostacoli in tempo reale e l'integrazione con i dispositivi indossabili, consentendo alle persone cieche di spostarsi in modo indipendente e sicuro, nonché di accedere più facilmente a informazioni e servizi. Technology Stack:
- **IA generativa (GEMINI) PER L'ELABORAZIONE DELLE IMMAGINI**
- **HTML/CSS**
- **API di rilevamento della profondità, API di riconoscimento vocale, librerie di conversione di testo in voce**
- **Firebase**
- **Integrazione di Blind Stick tramite il modulo ESP32**
- **Integrazione con gli occhiali smart**
**COME ABBIAMO UTILIZZATO L'API GEMINI:**
L'API Gemini consente lo streaming continuo dei dati dei sensori dai moduli LiDAR e della fotocamera all'unità di elaborazione dell'IA. In questo modo, VISION_AI ha sempre accesso alle informazioni ambientali più recenti, consentendo analisi e risposte in tempo reale.
Tramite l'API Gemini, VISION_AI integra perfettamente l'IA generativa di Google per il riconoscimento degli oggetti e la descrizione delle scene. L'API Gemini fornisce funzionalità essenziali per l'elaborazione delle immagini, come l'acquisizione delle immagini, la preelaborazione e l'estrazione di funzionalità.
Meccanismi di feedback:
sfruttando le funzionalità dell'API Gemini, VISION_AI fornisce all'utente un feedback uditivo e tattile istantaneo.

Realizzato con

  • Web/Chrome
  • Firebase

Team

Di

VISION_AI

Da

India