Blind Companion

Teknologi suara pendukung untuk pengguna buta

Fungsinya

Aplikasi menerima sinyal suara melalui perintah suara pengguna dan menganalisisnya menggunakan Google Gemini API untuk mengonversi perintah suara ini menjadi tindakan. Perintah ini dapat bervariasi. Perintah ini dapat berupa perintah untuk membuka aplikasi tertentu dan menjelajahi situs tertentu di Internet. Saya mengonfirmasi bahwa aplikasi dapat menangani semua tugas kompleks ini secara efisien. Beralih ke spesifikasi, hal ini dicapai dengan integrasi teknologi pengenalan suara lanjutan untuk merekam suara dan mengonversinya menjadi teks, lalu mengintegrasikan teknologi teks ke ucapan yang melakukan proses sebaliknya, yang memungkinkan pengguna memiliki pengalaman yang nyaman tanpa perlu menggunakan keyboard. Dengan menggunakan Google Gemini API, aplikasi dapat memberikan respons yang cepat dan akurat, sehingga meningkatkan pengalaman pengguna. Sekarang, saatnya menjelaskan langkah-langkah yang saya ikuti untuk menerapkan ide tersebut. Setelah mendapatkan ide, saya mulai memikirkan alat yang mungkin akan saya gunakan, lalu saya mulai menerapkan project. Setelah itu, saya mulai mengerjakan penerapannya. Masalah pertama yang saya hadapi adalah ada masalah saat mendownload program Python. Setelah melakukan riset, saya menemukan solusi untuk masalah ini melalui Google. Ini adalah kode yang telah saya kumpulkan melalui berbagai library online. Setiap kode library menjalankan fungsi tertentu. Setelah membuka terminal dan menunggu beberapa detik, kita akan mengucapkan kata "Open", dan program akan terbuka.

Dibuat dengan

  • Pengenalan Ucapan
  • Text-to-Speech - TTS

Tim

Oleh

Asisten Dunia

From

Mesir