Giúp bệnh nhân mắc bệnh Amyotrophic Lateral Sclerosis (ALS) giao tiếp bằng mắt
Ý nghĩa
Bệnh Amyotrophic Lateral Sclerosis (ALS) hay còn gọi là bệnh teo cơ bên là một căn bệnh tàn phá khiến bệnh nhân mất khả năng di chuyển và nói. Khi làm tình nguyện viên trong các hiệp hội ALS vào mùa hè thời trung học, tôi nhận thấy một số bệnh nhân chỉ có thể giao tiếp bằng mắt và công nghệ hỗ trợ, vốn có nhiều hạn chế như chi phí và hiệu quả. Được cung cấp bởi API Google Gemini, ứng dụng đa ngôn ngữ miễn phí của tôi có tên "Gaze Link" giúp bệnh nhân ALS giao tiếp độc lập, chính xác và hiệu quả bằng mắt.
Đầu tiên, tôi nhận dạng khuôn mặt và mắt của người dùng bằng Bộ công cụ học máy của Google và OpenCV. Sau 30 giây hiệu chỉnh và điều chỉnh chế độ cài đặt, người dùng có thể bắt đầu nhập từ trên bàn phím đa ngôn ngữ của Gaze Link bằng 6 cử chỉ mắt. Tuy nhiên, đối với các câu dài, việc nhập bằng mắt có thể diễn ra rất chậm.
Để cải thiện tốc độ nhập văn bản, tôi đã sử dụng mô hình Gemini 1.5 Flash để tạo câu mà bệnh nhân muốn nói dựa trên từ khoá và ngữ cảnh. Trước tiên, Gaze Link sẽ chép lời của người chăm sóc thành văn bản như "Nhiệt độ phòng có ổn không?". Sau đó, bệnh nhân sẽ nhập các từ khoá như "nóng, điều hòa, hai" bằng mắt. Mô hình Gemini sẽ sử dụng thông tin này để tạo một câu phù hợp như "Tôi nóng quá, bạn có thể giảm nhiệt độ điều hoà xuống 2 độ không?" trong vòng chưa đến một giây. Mô hình và bàn phím này cũng hoạt động với tiếng Tây Ban Nha và tiếng Trung. Các thử nghiệm với 30 người cho thấy rằng mô hình này có thể tiết kiệm đến 85% số lần nhấn phím của người dùng và giúp Gaze Link hiệu quả hơn 7 lần so với bảng chuyển điện tử truyền thống.
[[["Dễ hiểu","easyToUnderstand","thumb-up"],["Giúp tôi giải quyết được vấn đề","solvedMyProblem","thumb-up"],["Khác","otherUp","thumb-up"]],[["Thiếu thông tin tôi cần","missingTheInformationINeed","thumb-down"],["Quá phức tạp/quá nhiều bước","tooComplicatedTooManySteps","thumb-down"],["Đã lỗi thời","outOfDate","thumb-down"],["Vấn đề về bản dịch","translationIssue","thumb-down"],["Vấn đề về mẫu/mã","samplesCodeIssue","thumb-down"],["Khác","otherDown","thumb-down"]],[],[],[],null,["# Gaze Link\n\n[See all winners](/competition#w-4) \nBest Android app \n\nGaze Link\n=========\n\nHelps Amyotrophic Lateral Sclerosis (ALS) patients communicate with their eyes \nWhat it does\n\nAmyotrophic Lateral Sclerosis, or ALS, is a devastating disease that takes away the patient's ability to move and speak. As a volunteer in ALS associations during the summers of high school, I realized that some patients can only communicate with their eyes and assistive technology, which has many limitations like cost and efficiency. Powered by the Google Gemini API, my free multi-language app named \"Gaze Link\" helps ALS patients communicate with their eyes independently, accurately, and efficiently. \n\nFirst, I recognize the user's face and eyes with Google ML Kit and OpenCV. After a 30-second calibration and setting adjustments, the user can begin typing words on Gaze Link's multi-language keyboard with 6 eye gestures. However, eye-typing can be a very slow process for long sentences. \n\nTo improve the text-entry rate, I used a Gemini 1.5 Flash model to generate the patient's intended sentence based on keywords and the context. First, Gaze Link will transcribe the caretaker's voice into text like \"Is the room temperature ok?\". Then, the patient will type keywords like \"hot, AC, two\" with their eyes. The Gemini model will use the information to generate a suitable sentence like \"I am hot, can you turn the AC down by 2 degrees?\" in under a second. The model and keyboard also works with Spanish and Chinese. Experiments with 30 people show that the model can save up to 85% of user keystrokes and make Gaze Link 7x more effective than traditional E-transfer boards. \nBuilt with\n\n- Android\n- Firebase\n- Google ML Kit \nTeam \nBy\n\nXiangzhou Sun \nFrom\n\nUnited States \nMore winners \n[Outdraw.AI\nMost Creative app](/competition/projects/outdrawai) [Jayu\nBest Overall app](/competition/projects/jayu) \n[](/competition)"]]