Blind Companion
Görme engelli kullanıcılar için yardımcı ses teknolojisi
Ne işe yarar?
Uygulama, kullanıcının sesli komutları aracılığıyla ses sinyalleri alır ve bu sesli komutları işlemlere dönüştürmek için Google Gemini API'yi kullanarak bunları analiz eder. Bu komutlar değişiklik gösterebilir. Belirli bir uygulamayı açma ve internetteki belirli bir web sitesine göz atma komutları olabilir. Uygulamanın bu karmaşık görevlerin tümünü verimli bir şekilde yerine getirebileceğini onaylıyorum. Özelliklere gelirsek, bu özellik, sesi yakalayıp metne dönüştürmek için gelişmiş ses tanıma teknolojisinin entegrasyonu ve ardından tam tersini yapan metin okuma teknolojisinin entegrasyonu ile elde edilir. Bu sayede kullanıcılar klavye kullanmadan rahat bir deneyim yaşayabilir. Uygulama, Google Gemini API'yi kullanarak hızlı ve doğru yanıtlar verebilir. Bu da kullanıcı deneyimini iyileştirir. Şimdi, fikri uygulamak için uyguladığım adımları açıklamanın zamanı geldi. Fikri bulduktan sonra muhtemelen kullanacağım araçları düşünmeye başladım ve ardından projeyi uygulamaya başladım. Ardından, uygulama üzerinde çalışmaya başladım. Karşılaştığım ilk sorun, Python programını indirmeyle ilgiliydi. Biraz araştırma yaptıktan sonra Google üzerinden bu soruna bir çözüm buldum. Bu, internetteki farklı kütüphanelerden topladığım koddur. Her kitaplığın kodu belirli bir işlevi yerine getirir. Terminali açıp birkaç saniye bekledikten sonra "Aç" kelimesini söyleriz ve program açılır.
Aşağıdakilerle tasarlandı:
- Konuşma Tanıma
- Metin Okuma - TTS
Takım
Değişikliği yapan
World Assistants
Nereden
Mısır