Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

VISION_AI

Merevolusi navigasi untuk penyandang gangguan penglihatan.

Fungsinya

Vision_AI adalah sistem panduan AI yang dirancang untuk memberikan masukan dan petunjuk audio secara real time kepada orang buta berdasarkan lingkungan dan kebutuhan mereka. Dengan memanfaatkan AI generatif dan computer vision canggih, sistem ini menangkap dan memproses gambar serta suara dari lingkungan untuk menawarkan bantuan yang komprehensif. Proses otomatis ini mencakup Deteksi dan Penghindaran Hambatan Real-Time, serta Integrasi dengan Perangkat Wearable, yang memungkinkan orang buta bepergian secara mandiri dan aman sekaligus mengakses informasi dan layanan dengan lebih mudah. Stack Teknologi:
- **AI Generatif (GEMINI) UNTUK PEMROSESAN GAMBAR**
- **HTML/CSS**
- **Depth Sensing API, Speech Recognition API, Text-to-Speech Library**
- **Firebase**
- **Integrasi Blind Stick menggunakan Modul ESP32**
- **Integrasi dengan Smart Glasses**
**CARA KAMI MENGGUNAKAN GEMINI API:**
Gemini API memungkinkan streaming data sensor yang berkelanjutan dari modul LiDAR dan kamera ke unit pemrosesan AI. Hal ini memastikan bahwa VISION_AI selalu memiliki akses ke informasi lingkungan terbaru, sehingga memungkinkan analisis dan respons secara real time.
Melalui Gemini API, VISION_AI mengintegrasikan AI Generatif Google secara lancar untuk pengenalan objek dan deskripsi scene. Gemini API menyediakan fungsi penting untuk pemrosesan gambar, seperti pengambilan gambar, prapemrosesan, dan ekstraksi fitur
Mekanisme Masukan:
Dengan memanfaatkan kemampuan Gemini API, VISION_AI memberikan masukan auditori dan taktil instan kepada pengguna.

Dibuat dengan

Web/Chrome
Firebase

Tim

Oleh

VISION_AI

From

India