VisionAid
Giúp người khiếm thị khám phá thế giới nhờ sức mạnh của AI.
Ý nghĩa
VisionAid là một ứng dụng di động sáng tạo được thiết kế để hỗ trợ người khiếm thị bằng cách nâng cao khả năng di chuyển và tương tác với thế giới xung quanh. Nhờ tận dụng Mô hình Flash Gemini 1.5 nâng cao của Google, ứng dụng này sẽ chụp ảnh và gửi ảnh đến Gemini, cho phép người dùng xác định các vật thể hằng ngày, di chuyển trong không gian công cộng và thậm chí nhận ra khuôn mặt và thú cưng quen thuộc, tạo ra trải nghiệm kết nối và độc lập hơn.
Nhờ Mô hình Flash Gemini và API Chuyển văn bản sang lời nói của Google Cloud, giao diện trực quan của VisionAid giúp người dùng dễ dàng đặt câu hỏi về môi trường xung quanh và nhận được câu trả lời chính xác, tức thì thông qua phản hồi bằng giọng nói. Cho dù là xác định các mặt hàng trong cửa hàng tạp hoá, băng qua đường phố đông đúc một cách an toàn hay nhận ra một người bạn, VisionAid đều đóng vai trò như một người bạn đồng hành thông minh, giúp người dùng tự tin khám phá thế giới theo cách của họ.
VisionAid nhằm mục đích phá bỏ các rào cản và giúp người khiếm thị dễ dàng tiếp cận thế giới hơn bằng cách sử dụng công nghệ tiên tiến để thúc đẩy sự độc lập và nâng cao chất lượng cuộc sống hằng ngày. VisionAid không chỉ là một ứng dụng; đó là một bước tiến tới tương lai, nơi mọi người có thể trải nghiệm môi trường xung quanh một cách rõ ràng và tự tin nhờ những tiến bộ nhanh chóng của API.
Được tạo bằng
- Google Cloud Text-To-Speech
Nhóm
Từ
Đức