Portavoz virtual (MVP)
Representante de IA que habla en tu nombre para resolver tus problemas
Qué hace
Es un backend que recibe texto de la voz de una llamada telefónica, lo transforma en acciones y las ejecuta. El flujo es el siguiente:
- El usuario llama al número y le asigna una acción ("Llama a la farmacia local y comprueba si tienen medicamentos para el dolor de cabeza").
- El sistema, con la API de Gemini, solicita toda la información necesaria para la acción (como nombres, números de teléfono y direcciones).
- Cuando el sistema tiene toda la información, finaliza la llamada.
- Luego, el sistema revisa la llamada (con la API de Gemini) y la transforma en acciones (y toma notas de la información importante).
- Después de eso, el sistema ejecuta la acción (hace una llamada saliente) y habla con la persona objetivo de la acción.
- Cuando el sistema obtiene la información necesaria para considerar que la acción se completó, finaliza la llamada saliente.
- Por último, el sistema vuelve a llamar al usuario con el resumen de la acción.
La API de Gemini se usa para procesar todo el texto o chat:
- El texto de la llamada telefónica.
- El razonamiento para revisar y transformar el chat en acciones.
- El razonamiento para revisar y transformar el chat en notas.
- El razonamiento para revisar y transformar el chat en un resumen para la llamada de devolución.
Con la tecnología de
- Firebase
Equipo
De
Felippe Gallo
De
Brasil