VISION_AI
Cách mạng hoá tính năng điều hướng cho người khiếm thị.
Ý nghĩa
Vision_AI là một hệ thống hướng dẫn bằng AI được thiết kế để cung cấp cho người khiếm thị phản hồi và hướng dẫn bằng âm thanh theo thời gian thực dựa trên môi trường xung quanh và nhu cầu của họ. Bằng cách sử dụng công nghệ AI tạo sinh và thị giác máy tính tiên tiến, hệ thống sẽ chụp và xử lý hình ảnh cũng như âm thanh từ môi trường để hỗ trợ toàn diện. Quy trình tự động này bao gồm tính năng Phát hiện và tránh chướng ngại vật theo thời gian thực, cũng như tính năng Tích hợp với thiết bị đeo, giúp người khiếm thị di chuyển một cách độc lập và an toàn, đồng thời dễ dàng tiếp cận thông tin và dịch vụ hơn. Ngăn xếp công nghệ:
- **AI tạo sinh (GEMINI) ĐỂ XỬ LÝ HÌNH ẢNH**
- **HTML/CSS**
- **API cảm biến độ sâu, API nhận dạng lời nói, Thư viện chuyển văn bản sang lời nói**
- **Firebase**
- **Tích hợp Blind Stick bằng mô-đun ESP32**
- **Tích hợp với Kính thông minh**
**CÁCH CHÚNG TÔI SỬ DỤNG API GEMINI:**
API Gemini cho phép truyền liên tục dữ liệu cảm biến từ mô-đun LiDAR và máy ảnh đến đơn vị xử lý AI. Điều này đảm bảo rằng VISION_AI luôn có quyền truy cập vào thông tin môi trường mới nhất, cho phép phân tích và phản hồi theo thời gian thực.
Thông qua API Gemini, VISION_AI tích hợp liền mạch AI tạo sinh của Google để nhận dạng đối tượng và mô tả cảnh. API Gemini cung cấp các chức năng thiết yếu để xử lý hình ảnh, chẳng hạn như chụp ảnh, xử lý trước và trích xuất tính năng
Cơ chế phản hồi:
Tận dụng các chức năng của API Gemini, VISION_AI cung cấp phản hồi tức thì về thính giác và xúc giác cho người dùng.
Được tạo bằng
- Web/Chrome
- Firebase
Nhóm
Người cập nhật
VISION_AI
Từ
Ấn Độ