ناوبری کور
از طریق من ببینید
کاری که انجام می دهد
من برنامهای را ساختهام که به افراد آسیبدیده کمک میکند تا در اطراف خود حرکت کنند، برنامه دارای 3 حالت اصلی "حالت پیمایش" است که کاربر را در مورد محیط خود راهنمایی میکند، "حالت دستیار" که به کاربر کمک میکند هر چیز خاصی را در مورد اطراف خود بپرسد و در نهایت "حالت خواندن" است که به کاربر کمک میکند هر چیزی مانند کتاب یا هر علامتی را بخواند.
Gemini AI API در سه فایل در پروژه استفاده شده است و هر فایل به هر حالت فوق اختصاص داده شده است.
بنابراین، دوربین تلفن همراه کاربر، فریمهای زمانی/تصاویر زنده را میگیرد و سپس به کادر ورودی Gemini ارسال میکند و سپس Gemini آن را به عنوان خروجی ایجاد میکند، همانطور که هر مدل آموزش داده میشود و سپس اعلانهای خروجی روی پوشش نمایش داده میشود و سپس با کمک TTS (متن به گفتار) فرد نابینا میتواند آن صدا را بشنود و به راحتی میتواند حرکت کند.
ساخته شده با
- اندروید
تیم
توسط
احد یا ناو کور
از
پاکستان