Anuj Sharma

Assistente por voz que pode ver o mundo

O que faz?

Eu amo a API do Google (Gemini) porque ela fornece resultados completos e quero fazer meu projeto menor com a ajuda da API Gemini. Então
criei um aplicativo Python ou um tipo de software com a visão de criar uma IA de singularidade ou assistente de voz. Agora, há muito código ou projetos em que os assistentes de voz recebem comandos por voz e retornam o resultado por voz, mas não conseguem ver nossa consulta em forma de visão. Por isso, fiz esse tipo de projeto com a ajuda da API Gemini (pro e vision pro). Agora, meu assistente de voz também consegue receber a entrada como imagem e responder minha resposta em texto e também por voz

Desenvolvido com

  • Nenhum
  • Firebase

Equipe

Por

Kritrim

De

Índia