Porte-parole virtuel (MVP)

Un représentant de l'IA qui parle en votre nom pour résoudre vos problèmes

Description

Il s'agit d'un backend qui reçoit le texte de la voix d'un appel téléphonique, le transforme en actions et les exécute. Le flux est le suivant:
- L'utilisateur appelle le numéro et lui donne une action ("Appeler la pharmacie locale et vérifier s'ils ont des médicaments contre les maux de tête")
- Le système, à l'aide de l'API Gemini, demande toutes les informations nécessaires à l'action (noms, numéros de téléphone, adresses, etc.)
- Lorsque le système dispose de toutes les informations, l'appel se termine
- Le système examine l'appel (à l'aide de l'API Gemini) et le transforme en actions (et prend des notes sur les informations importantes)
- Ensuite, le système exécute l'action (effectue un appel sortant) et parle à la personne cible de l'action
- Lorsque le système obtient les informations nécessaires pour considérer l'action comme terminée, l'appel sortant se termine
- Enfin, le système rappelle l'utilisateur avec le résumé de l'action

L'API Gemini est utilisée pour traiter tous les messages/discussions:
- Le message de l'appel téléphonique
- Le raisonnement pour examiner et transformer la discussion en actions
- Le raisonnement pour examiner et transformer la discussion en notes
- Le raisonnement pour examiner et transformer la discussion en résumé pour l'appel de retour

Conçu avec

  • Firebase

Équipe

Par

Felippe Gallo

De

Brésil