Gemini Voice Companion

Usare Gemini in modalità vocale per l'assistente personale

Descrizione

Si tratta di un assistente vocale basato sull'IA di Gemini, con funzionalità di sintesi vocale e conversione della voce in testo locali che collegano le interazioni vocali e di testo. L'API Gemini eccelle nella comprensione del contesto e nell'invio di comandi per vari scenari. Creando un contesto e utilizzando le integrazioni API, Gemini può eseguire script Python per svolgere diverse funzioni.
In questa applicazione, gli utenti possono interagire con l'assistente interamente tramite comandi vocali, consentendo il funzionamento senza mani e senza occhi. Questo lo rende particolarmente utile in situazioni in cui la voce è l'unico mezzo di comunicazione disponibile. Le funzionalità dell'assistente includono:

Riconoscimento di più altoparlanti
Filtro del rumore vocale sconosciuto
Controllo dei dispositivi per la smart home
Imitazione della voce dell'utente
Passaggio da una voce all'altra e da una personalità all'altra
Lettura e riepilogo di articoli di notizie
Ricezione di informazioni sul meteo e di altro tipo
Riproduzione di musica di Spotify
Acquisizione e analisi di foto
Navigazione tramite link in Chrome
Pianificazione di un promemoria vocale o di un'azione generica

La versatilità e il design incentrato sulla voce dell'assistente basato su Gemini lo rendono uno strumento potente per una vasta gamma di applicazioni hands-free e eyes-free, tra cui intrattenimento in auto, guide turistiche, gestione della casa e così via.

Realizzato con

  • Web/Chrome

Team

Di

Zhenya Yang

Da

Australia