SmartVision

Dòng giới thiệu: Tự tin khám phá thế giới, tự tin sống

Ý nghĩa

SmartVision là một trợ lý di động dành cho người dùng
khiếm thị/khuyết tật thị giác,giúp họ tăng cường khả năng hỗ trợ tiếp cận,
sự độc lập và hỗ trợ trong cuộc sống hằng ngày. Trợ lý di động này tận dụng công nghệ để cung cấp nhiều tính năng và chức năng phù hợp với nhu cầu của những người khiếm thị, nhằm giúp họ dễ dàng quản lý công việc hằng ngày và tham gia tích cực hơn vào xã hội.
Ứng dụng Android này có các tính năng như Phát hiện đối tượng, Tóm tắt tài liệu, Chế độ đọc, Phát hiện khuôn mặt, Quét sản phẩm. Các tính năng Phát hiện đối tượng và Tóm tắt tài liệu được tạo bằng Gemini API.Cụ thể, tính năng Phát hiện đối tượng sử dụng mô hình Gemini-1.5-Flash vì mô hình này nhanh hơn so với Gemini-1.5-Pro. Để sử dụng tính năng phát hiện đối tượng, người dùng sẽ phải đội một chiếc mũ thông minh có mô-đun máy ảnh có hỗ trợ Wi-Fi. Hình ảnh được chụp từ máy ảnh này sẽ hiển thị trên ứng dụng di động và được gửi đến API Gemini từ xa để mô tả hình ảnh được chụp theo thời gian thực bằng API Gemini. Nội dung mô tả sẽ được đọc to hoặc thông báo cho người dùng bằng tính năng chuyển văn bản sang lời nói để thuận tiện cho người dùng khiếm thị. Hơn nữa, tài liệu tóm tắt(chỉ PDF) được tạo bằng mô hình Gemini-1.5-pro. Để sử dụng tính năng này, người dùng cần chọn một tài liệu pdf nằm trong bộ nhớ của điện thoại và đặt một văn bản lời nhắc (ví dụ: tóm tắt tài liệu pdf trong 150 từ). Gemini API sẽ tóm tắt nội dung văn bản có trong tệp pdf và thông báo cho người dùng.

Được tạo bằng

  • Android
  • Bộ công cụ học máy(Gắn nhãn hình ảnh
  • Phát hiện và theo dõi đối tượng
  • Nhận dạng văn bản
  • Quét mã vạch
  • Phát hiện khuôn mặt)

Nhóm

Người cập nhật

SmartVision (Thành viên nhóm : Karthik Ramachandran)

Từ

Ấn Độ