Blind Companion

تكنولوجيا التفاعل الصوتي المساعِدة للمستخدمين المكفوفين

وظيفتها

يتلقّى التطبيق إشارات صوتية من خلال أوامر المستخدم الصوتية ويحلّلها باستخدام Google Gemini API لتحويل هذه الأوامر الصوتية إلى إجراءات. يمكن أن تختلف هذه الأوامر. يمكن أن تكون هذه الطلبات لفتح تطبيق معيّن وتصفّح موقع إلكتروني معيّن على الإنترنت. أؤكّد أنّ التطبيق يمكنه معالجة جميع هذه المهام المعقّدة بكفاءة. أمّا بالنسبة إلى المواصفات، فيتم تحقيقها من خلال دمج تكنولوجيا التعرّف على الصوت المتقدّمة لتسجيل الصوت وتحويله إلى نص، ثم دمج تكنولوجيا تحويل النص إلى كلام التي تُجري العملية العكسية، ما يتيح للمستخدمين الحصول على تجربة مريحة بدون الحاجة إلى استخدام لوحة مفاتيح. باستخدام Google Gemini API، يمكن للتطبيق تقديم ردود سريعة ودقيقة، ما يعزّز تجربة المستخدم. حان الوقت الآن لشرح الخطوات التي اتّبعتها لتنفيذ الفكرة. بعد أن خطرت لي الفكرة، بدأت أفكر في الأدوات التي سأستخدمها على الأرجح، ثم بدأت في تنفيذ المشروع. بعد ذلك، بدأت العمل على تطبيقه. المشكلة الأولى التي واجهتها هي أنّه حدثت مشكلة في تنزيل برنامج Python. بعد إجراء بعض الأبحاث، عثرت على حل لهذه المشكلة من خلال Google. هذا هو الرمز الذي جمعته من خلال مكتبات مختلفة على الإنترنت. تؤدي رمز كل مكتبة وظيفة معيّنة. بعد فتح وحدة التحكّم الطرفية والانتظار لبضع ثوانٍ، سنقول كلمة "فتح"، وسيتم فتح البرنامج.

مصمَّم بالاستناد إلى

  • التعرّف على الكلام
  • تحويل النص إلى كلام (TTS)

الفريق

من

مساعدون في جميع أنحاء العالم

من

مصر