Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini Voice Companion

Utiliser Gemini comme assistant personnel par commande vocale

Description

Il s'agit d'un assistant vocal optimisé par l'IA Gemini, qui propose des fonctionnalités de synthèse vocale et de reconnaissance vocale locales qui relient les interactions vocales et textuelles. L'API Gemini excelle dans la compréhension du contexte et la distribution des commandes pour différents scénarios. En créant du contexte et en utilisant des intégrations d'API, Gemini peut exécuter des scripts Python pour effectuer diverses fonctions.
Dans cette application, les utilisateurs peuvent interagir entièrement avec l'assistant par commande vocale, ce qui leur permet de l'utiliser sans les mains ni les yeux. Il est donc particulièrement utile dans les situations où la voix est le seul moyen de communication disponible. Voici quelques-unes des fonctionnalités de l'assistant:

Reconnaissance de plusieurs locuteurs
Filtrage du bruit vocal inconnu
Contrôle des appareils de la maison connectée
Imitation de la voix de l'utilisateur
Changement de voix et de personnalité
Lecture et résumé d'articles d'actualité
Obtenir la météo et d'autres informations
Écouter de la musique Spotify
Prendre des photos et les analyser
Accéder à un lien via Chrome
Planifier un rappel vocal ou une action générique

La polyvalence et la conception centrée sur la voix de l'assistant Gemini en font un outil puissant pour un large éventail d'applications mains libres et sans contact visuel, y compris l'animation dans la voiture, le guidage à pied, la gestion de la maison, etc.

Conçu avec

Web/Chrome

Équipe

Par

Zhenya Yang

Australie