視覚障がい者向けのライブ アシスタント

視覚障がい者向けの AI を活用したリアルタイム支援アプリ。

機能

盲人支援用に設計されたこのアプリは、Gemini API を統合し、音声認識とコンピューター ビジョンを介してリアルタイムで詳細な支援を提供します。ユーザーは周囲の状況や撮影した画像の説明をリクエストできるため、ユーザーの利便性と安全性が向上します。Gemini API を使用すると、正確でコンテキストに沿った説明を簡単に生成できるため、視覚障がいのあるユーザーが環境を自立して操作できます。Gemini API を使用して、アプリから送信された画像を記述し、盲目のユーザーに危険を警告したり、Gemini API を使用して物体や場所を特定したりできるようにしました。

構成

  • Python

チーム

By

Rojan Sapkota

差出人

ネパール