VisionAid

AI の力を活用して、視覚障がい者が世界を移動できるように支援します。

機能

VisionAid は、視覚障がいのあるユーザーが周囲の環境を移動したり操作したりする能力を高め、自立を支援するために設計された革新的なモバイルアプリです。Google の高度な Gemini 1.5 Flash モデルを活用したこのアプリは、画像を撮影して Gemini に送信します。これにより、ユーザーは日常的な物体を識別したり、公共の場所を移動したり、見慣れた顔やペットを認識したりできるため、よりつながりのある自立した生活を送ることができます。

VisionAid の直感的なインターフェースにより、ユーザーは周囲の状況について簡単に質問でき、Gemini Flash モデルと Google Cloud Text-To-Speech API により、音声フィードバックを通じて即座に正確な回答を得ることができます。スーパーマーケットの商品の識別、交通量の多い道路の安全な横断、友人の認識など、VisionAid はユーザーが自分のペースで世界を探索できるように、インテリジェントなコンパニオンとして機能します。

VisionAid は、最先端のテクノロジーを使用して、視覚障がい者の自立を促進し、日常生活を向上させることで、障壁を打ち破り、視覚障がい者が世界をより身近に感じられる環境を実現することを目指しています。VisionAid は単なるアプリではありません。API の急速な進歩により、誰もが周囲を明確かつ自信を持って体験できる未来への一歩です。

構成

  • Google Cloud Text-To-Speech

チーム

差出人

ドイツ