Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini Voice Companion

Usar o Gemini como assistente pessoal com comandos de voz

O que faz?

Esse é um assistente por voz com tecnologia de IA Gemini que oferece recursos locais de conversão de texto em fala e de fala em texto que conectam interações de voz e texto. A API do Gemini se destaca na compreensão do contexto e na transmissão de comandos para vários cenários. Ao criar o contexto e usar integrações de API, o Gemini pode executar scripts Python para realizar diversas funções.
Neste aplicativo, os usuários podem interagir com o assistente totalmente por voz, o que permite a operação sem usar as mãos e sem olhar para a tela. Isso é útil principalmente em situações em que a voz é o único meio de comunicação disponível. Os recursos do assistente incluem:

Reconhecimento de vários alto-falantes
Filtragem de ruído de voz desconhecida
Controle de dispositivos de casa inteligente
Imitação da voz do usuário
Troca entre vozes e personalidades diferentes
Leitura e resumo de artigos de notícias
Consulta de informações meteorológicas e outras informações
Reprodução de músicas do Spotify
Captura e análise de fotos
Navegação de links pelo Chrome
Programação de lembretes de voz ou uma ação genérica

A versatilidade e o design focado em voz do assistente com tecnologia Gemini fazem dele uma ferramenta poderosa para uma ampla gama de aplicativos sem uso das mãos e dos olhos, incluindo entretenimento no carro, guia de caminhada, gerenciamento de casa etc.

Desenvolvido com

Web/Chrome

Equipe

Por

Zhenya Yang

Austrália