Trợ lý trực tiếp dành cho người khiếm thị

Ứng dụng hỗ trợ theo thời gian thực dựa trên AI dành cho người khiếm thị.

Ý nghĩa

Ứng dụng của chúng tôi được thiết kế để hỗ trợ người khiếm thị, tích hợp API Gemini để cung cấp dịch vụ hỗ trợ mô tả theo thời gian thực thông qua tính năng nhận dạng lời nói và thị giác máy tính. Người dùng có thể yêu cầu mô tả về môi trường xung quanh hoặc hình ảnh đã chụp, giúp tăng khả năng hỗ trợ tiếp cận và sự an toàn. API Gemini hỗ trợ tạo nội dung mô tả chính xác và phù hợp với ngữ cảnh, giúp người dùng khiếm thị tự mình di chuyển và tương tác với môi trường xung quanh. Tôi đã sử dụng Gemini API để mô tả hình ảnh được gửi từ ứng dụng nhằm cảnh báo người khiếm thị về sự nguy hiểm hoặc giúp họ xác định các đối tượng và địa điểm bằng Gemini API.

Được tạo bằng

  • Python

Nhóm

Người cập nhật

Rojan Sapkota

Từ

Nepal