TwilightNav

視覚障がいのあるユーザーがインターネットを操作できるように支援します。

機能

このアプリは Gemini API を使用して、次の 2 つの主要な機能を通じてユーザー インタラクションを強化します。

コンテンツの分析と構造化: Gemini API はウェブページの HTML 形式を分析し、階層型のツリー構造に変換します。この構造では、各ノードは特定のコンテンツ要素を表し、その要素の説明と子要素の概要の両方を含みます。この構造により、ウェブページのコンテンツを効率的に処理して理解できます。

インテントの認識とナビゲーション: Gemini API は、ユーザーの指示を理解するうえでも重要な役割を果たします。音声入力を処理してユーザーの意図を検出し、ツリー構造内の対応するターゲット ノードを特定します。この API は、ユーザー コマンドを 6 つのインテント(ウェブサイトへの移動、要約、コンテンツの読み上げ、情報の照会、要素のクリック、フォームへの入力)に分類します。

これらの機能を活用することで、ユーザーは音声コマンドとジェスチャーでさまざまなウェブベースのタスクを実行できるため、ブラウジングがよりアクセスしやすく直感的になります。

構成

  • Android

チーム

By

TwilightNav

差出人

オーストラリア