Blind Companion

טכנולוגיית קול מסייעת למשתמשים עיוורים

תיאור

האפליקציה מקבלת אותות קוליים דרך הפקודות הקוליות של המשתמש ומנתחת אותם באמצעות Google Gemini API כדי להמיר את הפקודות הקוליות האלה לפעולות. הפקודות האלה עשויות להשתנות. הן יכולות להיות פקודות לפתיחת אפליקציה ספציפית ולגלישה באתר ספציפי באינטרנט. אני מאשר/ת שהאפליקציה יכולה לטפל ביעילות בכל המשימות המורכבות האלה. בנוגע למפרטים, הם מתקבלים באמצעות שילוב של טכנולוגיית זיהוי קולי מתקדמת כדי לתעד את הקול ולהמיר אותו לטקסט, ולאחר מכן שילוב של טכנולוגיית טקסט לדיבור שמבצעת את התהליך ההפוך. כך המשתמשים יכולים ליהנות מחוויה נוחה בלי צורך להשתמש במקלדת. בעזרת Google Gemini API, האפליקציה יכולה לספק תשובות מהירות ומדויקות, וכך לשפר את חוויית המשתמש. עכשיו אסביר אילו שלבים ביצעתי כדי להטמיע את הרעיון. אחרי שהגעתי לרעיון, התחלתי לחשוב על הכלים שאשתמש בהם, ואז התחלתי להטמיע את הפרויקט. לאחר מכן התחלתי לעבוד על היישום שלו. הבעיה הראשונה שבה נתקלת הייתה בעיה בהורדה של תוכנת Python. אחרי מחקר קצר, מצאתי פתרון לבעיה הזו דרך Google. זהו הקוד שאספתי באמצעות ספריות שונות באינטרנט. הקוד של כל ספרייה מבצע פונקציה ספציפית. אחרי שנפתח את מסוף ה-Terminal ונמתין כמה שניות, נאמר את המילה 'Open' והתוכנית תיפתח.

מבוסס על

  • זיהוי דיבור
  • המרת טקסט לדיבור (TTS)

קבוצה

על ידי

World Assistants

מאת

מצרים