Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini Voice Companion

Korzystanie z Gemini jako osobistego asystenta za pomocą komend głosowych

Działanie

Jest to asystent głosowy oparty na sztucznej inteligencji Gemini, który umożliwia lokalną zamianę tekstu na mowę i mowę na tekst, łącząc w ten sposób interakcje głosowe i tekstowe. Interfejs API Gemini doskonale rozumie kontekst i wysyła polecenia w różnych sytuacjach. Dzięki budowaniu kontekstu i wykorzystywaniu integracji z API Gemini może wykonywać skrypty Pythona, aby realizować różne funkcje.
W tej aplikacji użytkownicy mogą wchodzić w interakcję z asystentem wyłącznie za pomocą głosu, co umożliwia obsługę bez użycia rąk i bez patrzenia na ekran. Jest to szczególnie przydatne w sytuacjach, gdy głos jest jedynym dostępnym sposobem komunikacji. Asystent może m.in.:

rozpoznawać głosy wielu użytkowników;
filtrować szum nieznanego głosu;
sterować urządzeniami w inteligentnym domu;
naśladować głos użytkownika;
przełączać się między różnymi głosami i osobami;
czytać i podsumowywać artykuły z wiadomości;
pozyskiwać informacje o pogodzie i inne;
odtwarzać muzykę z Spotify;
robić i analizować zdjęcia;
otwierać linki w Chrome;
planować przypomnienia głosowe lub inne działania.

Wszechstronność i projektowanie z myślą o głosie sprawiają, że asystent oparty na Gemini jest potężnym narzędziem do wielu zastosowań niewymagających rąk i oczu, w tym w rozrywce w samochodzie, przewodnikach turystycznych, zarządzaniu domem itp.

Utworzone za pomocą

Sieć/Chrome

Zespół

Autor:

Zhenya Yang

Australia