جریان خودکار

توانمندسازی کنترل کامپیوتری بدون دردسر از طریق زبان طبیعی.

کاری که انجام می دهد

AutoFlow یک دستیار دسترسی صوتی است که با ادغام Gemini به عنوان یک عامل قدرتمند و مبتنی بر زبان طبیعی، استفاده از رایانه و ناوبری کاربران دارای معلولیت جسمی را ساده می کند.

جوزا به عنوان مغز 3 عامل ما عمل می کند.
### عامل برنامه ریزی
عامل برنامه ریزی مسئول ایجاد یک طرح از عنصر UI و اسکرین شات است، عنصر UI از Win32 UIAutomation API استخراج می شود و اسکرین شات از Win32 User API گرفته شده است و از Gemini می خواهد که از این داده ها یک طرح ایجاد کند.
این عامل فقط عملکردی برای شروع اجرای طرح دارد و به سیستم برنامه ریزی حلقه ارسال می شود.

### نماینده را شناسایی کنید
Identify agent مسئول شناسایی عنصر UI است که کاربر می خواهد با آن تعامل داشته باشد مانند دکمه یا پیوندها، این عامل از Gemini برای شناسایی عنصری که کاربر می خواهد با آن تعامل داشته باشد استفاده می کند.

### عامل ناوبری
عامل ناوبری مسئول اجرای رویداد ماوس و صفحه کلید برای تعامل با صفحه است، این عامل از Gemini برای تبدیل زبان طبیعی مانند "کلیک چپ" به اجرای ماوس و صفحه کلید استفاده می کند.

ساخته شده با

  • Google Speech to Text (STT)

تیم

توسط

جریان خودکار

از

تایلند

،

جریان خودکار

توانمندسازی کنترل کامپیوتری بدون دردسر از طریق زبان طبیعی.

کاری که انجام می دهد

AutoFlow یک دستیار دسترسی صوتی است که با ادغام Gemini به عنوان یک عامل قدرتمند و مبتنی بر زبان طبیعی، استفاده از رایانه و ناوبری کاربران دارای معلولیت جسمی را ساده می کند.

جوزا به عنوان مغز 3 عامل ما عمل می کند.
### عامل برنامه ریزی
عامل برنامه ریزی مسئول ایجاد یک طرح از عنصر UI و اسکرین شات است، عنصر UI از Win32 UIAutomation API استخراج می شود و اسکرین شات از Win32 User API گرفته شده است و از Gemini می خواهد که از این داده ها یک طرح ایجاد کند.
این عامل فقط عملکردی برای شروع اجرای طرح دارد و به سیستم برنامه ریزی حلقه ارسال می شود.

### نماینده را شناسایی کنید
Identify agent مسئول شناسایی عنصر UI است که کاربر می خواهد با آن تعامل داشته باشد مانند دکمه یا پیوندها، این عامل از Gemini برای شناسایی عنصری که کاربر می خواهد با آن تعامل داشته باشد استفاده می کند.

### عامل ناوبری
عامل ناوبری مسئول اجرای رویداد ماوس و صفحه کلید برای تعامل با صفحه است، این عامل از Gemini برای تبدیل زبان طبیعی مانند "کلیک چپ" به اجرای ماوس و صفحه کلید استفاده می کند.

ساخته شده با

  • Google Speech to Text (STT)

تیم

توسط

جریان خودکار

از

تایلند