AutoFlow

Permite controlar la computadora sin esfuerzo a través del lenguaje natural.

Qué hace

AutoFlow es un asistente de accesibilidad por voz diseñado para simplificar el uso de computadoras y la navegación de los usuarios con discapacidades físicas mediante la integración de Gemini como un agente potente y basado en lenguaje natural.

Gemini funciona como el cerebro de nuestros 3 agentes.
### Agente de planificación
El agente de planificación es responsable de crear un plan a partir del elemento de la IU y la captura de pantalla. El elemento de la IU se extrae de la API de Win32 UIAutomation y la captura de pantalla se toma de la API de Win32 User. Le pedirá a Gemini que cree un plan a partir de estos datos.
Este agente solo tiene la función de iniciar la ejecución del plan y lo reenviará al sistema de planificación de anillos.

### Agente de identificación
El agente de identificación es responsable de identificar el elemento de la IU con el que el usuario desea interactuar, como un botón o un vínculo. Este agente usará Gemini para identificar el elemento con el que el usuario desea interactuar.

### Agente de navegación
El agente de navegación es responsable de ejecutar el evento del mouse y el teclado para interactuar con la pantalla. Este agente usará Gemini para convertir el lenguaje natural, como "clic izquierdo", en la ejecución del mouse y el teclado.

Con la tecnología de

  • Google Voz a texto (STT)

Equipo

De

AutoFlow

De

Tailandia