Anuj Sharma
Assistente por voz que pode ver o mundo
O que faz?
Eu amo a API do Google (Gemini) porque ela fornece resultados completos e quero fazer meu projeto menor com a ajuda da API Gemini. Então
criei um aplicativo Python ou um tipo de software com a visão de criar uma IA de singularidade ou assistente de voz. Agora, há muito código ou projetos em que os assistentes de voz recebem comandos por voz e retornam o resultado por voz, mas não conseguem ver nossa consulta em forma de visão. Por isso, fiz esse tipo de projeto com a ajuda da API Gemini (pro e vision pro). Agora, meu assistente de voz também consegue receber a entrada como imagem e responder minha resposta em texto e também por voz
Desenvolvido com
- Nenhum
- Firebase
Equipe
Por
Kritrim
De
Índia