Gemini 音声コンパニオン

音声操作で Gemini をパーソナル アシスタントとして使用する

機能

Gemini AI を搭載した音声アシスタントです。音声とテキストのやり取りをつなぐローカルのテキスト読み上げ機能と音声文字変換機能を備えています。Gemini の API は、さまざまなシナリオのコンテキストを理解し、コマンドをディスパッチすることに優れています。コンテキストを構築し、API 統合を活用することで、Gemini は Python スクリプトを実行してさまざまな機能を実行できます。
このアプリでは、ユーザーは音声のみでアシスタントとやり取りできるため、ハンズフリーで目を離さずに操作できます。音声が唯一のコミュニケーション手段である状況では特に便利です。アシスタントの機能には、次のようなものがあります。

複数のスピーカーの認識
不明な音声ノイズのフィルタリング
スマートホーム デバイスの操作
ユーザーの声の模倣
さまざまな声や個性との切り替え
ニュース記事の読み上げと要約
天気などの情報の取得
Spotify 音楽の再生
写真の撮影と分析
Chrome でリンクを操作
音声リマインダーや一般的なアクションのスケジュール設定

Gemini を搭載したアシスタントは、多様性と音声重視の設計により、ハンズフリーで目を離さずにさまざまなアプリケーションを操作できる強力なツールです。車内エンターテイメント、ウォーキング ガイド、家事管理などに対応しています。

構成

  • ウェブ/Chrome

チーム

By

Zhenya Yang

差出人

オーストラリア