Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

VISION_AI

視覚障がい者向けのナビゲーションを革新します。

機能

Vision_AI は、視覚障がいのあるユーザーに、周囲の状況やニーズに基づいてリアルタイムの音声フィードバックと指示を提供する AI ガイダンスシステムです。最先端の生成 AI とコンピュータビジョンを活用し、環境の画像と音声をキャプチャして処理することで、包括的な支援を提供します。この自動化されたプロセスには、障害物のリアルタイム検出と回避、ウェアラブルデバイスとの統合が含まれており、視覚障がいのある人が情報やサービスに簡単にアクセスしながら、独立して安全に移動できるようにします。技術スタック:
- **画像処理用の生成 AI（GEMINI）**
- **HTML/CSS**
- **Depth Sensing API、Speech Recognition API、Text-to-Speech ライブラリ**
- **Firebase**
- **ESP32 モジュールを使用した盲人用スティックとの統合**
- **スマートグラスとの統合**
**GEMINI API の使用方法:**
Gemini API を使用すると、LiDAR モジュールとカメラモジュールから AI 処理ユニットにセンサーデータを継続的にストリーミングできます。これにより、VISION_AI は常に最新の環境情報にアクセスできるため、リアルタイムの分析と対応が可能になります。
VISION_AI は Gemini API を介して、オブジェクト認識とシーン記述のための Google の生成 AI をシームレスに統合します。Gemini API は、画像キャプチャ、前処理、特徴抽出など、画像処理に不可欠な機能を提供します。
フィードバックメカニズム:
Gemini API の機能を活用して、VISION_AI はユーザーに即時的な聴覚と触覚のフィードバックを返します。

構成

ウェブ/Chrome
Firebase

チーム

VISION_AI

差出人

インド