VISION_AI
Merevolusi navigasi untuk penyandang gangguan penglihatan.
Fungsinya
Vision_AI adalah sistem panduan AI yang dirancang untuk memberikan masukan dan petunjuk audio secara real time kepada orang buta berdasarkan lingkungan dan kebutuhan mereka. Dengan memanfaatkan AI generatif dan computer vision canggih, sistem ini menangkap dan memproses gambar serta suara dari lingkungan untuk menawarkan bantuan yang komprehensif. Proses otomatis ini mencakup Deteksi dan Penghindaran Hambatan Real-Time, serta Integrasi dengan Perangkat Wearable, yang memungkinkan orang buta bepergian secara mandiri dan aman sekaligus mengakses informasi dan layanan dengan lebih mudah. Stack Teknologi:
- **AI Generatif (GEMINI) UNTUK PEMROSESAN GAMBAR**
- **HTML/CSS**
- **Depth Sensing API, Speech Recognition API, Text-to-Speech Library**
- **Firebase**
- **Integrasi Blind Stick menggunakan Modul ESP32**
- **Integrasi dengan Kacamata Cerdas**
**CARA KAMI MENGGUNAKAN GEMINI API:**
Gemini API memungkinkan streaming data sensor yang berkelanjutan dari modul LiDAR dan kamera ke unit pemrosesan AI. Hal ini memastikan bahwa VISION_AI selalu memiliki akses ke informasi lingkungan terbaru, sehingga memungkinkan analisis dan respons secara real-time.
Melalui Gemini API, VISION_AI mengintegrasikan AI Generatif Google secara lancar untuk pengenalan objek dan deskripsi scene. Gemini API menyediakan fungsi penting untuk pemrosesan gambar, seperti pengambilan gambar, prapemrosesan, dan ekstraksi fitur
Mekanisme Masukan:
Dengan memanfaatkan kemampuan Gemini API, VISION_AI memberikan masukan auditori dan taktil instan kepada pengguna.
Dibuat dengan
- Web/Chrome
- Firebase
Tim
Oleh
VISION_AI
From
India