Porta-voz virtual (MVP)

Representante de IA que fala em seu nome para resolver seus problemas

O que faz?

É um back-end que recebe texto de voz de uma chamada telefônica, transforma em ações e as executa. O fluxo é o seguinte:
- O usuário liga para o número e solicita uma ação ("Ligar para a farmácia local e verificar se eles têm remédio para dor de cabeça")
- O sistema, usando a API Gemini, solicita todas as informações necessárias para a ação (como nomes, números de telefone, endereços etc.)
- Quando o sistema recebe todas as informações, a chamada termina
- Em seguida, o sistema analisa a chamada (usando a API Gemini) e transforma em ações (e anota informações importantes)
- Depois disso, o sistema executa a ação (faz uma chamada de saída) e fala com a pessoa alvo da ação
- Quando o sistema recebe as informações necessárias para considerar a ação concluída, a chamada de saída é encerrada
- Por fim, o sistema liga para o usuário com o resumo da ação

A API Gemini é usada para processar todo o texto/chat:
- O texto da ligação telefônica
- O raciocínio para analisar e transformar o chat em ações
- O raciocínio para analisar e transformar o chat em notas
- O raciocínio para analisar e transformar o chat em resumo para a chamada de retorno

Desenvolvido com

  • Firebase

Equipe

Por

Felippe Gallo

De

Brasil