Gemini Voice Companion
Usar o Gemini como assistente pessoal com comandos de voz
O que faz?
Esse é um assistente por voz com tecnologia de IA Gemini que oferece recursos locais de conversão de texto em fala e de fala em texto que conectam interações de voz e texto. A API do Gemini se destaca na compreensão do contexto e na transmissão de comandos para vários cenários. Ao criar o contexto e usar integrações de API, o Gemini pode executar scripts Python para realizar diversas funções.
Neste aplicativo, os usuários podem interagir com o assistente totalmente por voz, o que permite a operação sem usar as mãos e sem olhar para a tela. Isso é útil principalmente em situações em que a voz é o único meio de comunicação disponível. Os recursos do assistente incluem:
Reconhecimento de vários alto-falantes
Filtragem de ruído de voz desconhecida
Controle de dispositivos de casa inteligente
Imitação da voz do usuário
Troca entre vozes e personalidades diferentes
Leitura e resumo de artigos de notícias
Consulta de informações meteorológicas e outras informações
Reprodução de músicas do Spotify
Captura e análise de fotos
Navegação de links pelo Chrome
Programação de lembretes de voz ou uma ação genérica
A versatilidade e o design focado em voz do assistente com tecnologia Gemini fazem dele uma ferramenta poderosa para uma ampla gama de aplicativos sem uso das mãos e dos olhos, incluindo entretenimento no carro, guia de caminhada, gerenciamento de casa etc.
Desenvolvido com
- Web/Chrome
Equipe
Por
Zhenya Yang
De
Austrália