Anuj Sharma

周囲の状況を把握できる音声アシスタント

機能

実りある結果を提供してくれる Google の API(Gemini)が大好きです。Gemini API を使って小規模なプロジェクトを作成したいと考えました。そこで、
Singularity AI や音声アシスタントを作成するというビジョンを掲げて、Python アプリケーションやソフトウェアを作成しました。現在、音声アシスタントが音声でコマンドを受け取り、音声で結果を返すコードやプロジェクトはたくさんありますが、クエリをビジョンの形で確認することはできません。そこで、Gemini API(Pro と Vision Pro)を使って、この種のプロジェクトを作成しました。これで、音声アシスタントは入力を画像として取得し、テキストと音声で回答を返すことができます。

構成

  • なし
  • Firebase

チーム

By

Kritrim

差出人

インド