AutoFlow

Doğal dil sayesinde zahmetsiz bilgisayar kontrolüne olanak tanır.

Ne işe yarar?

AutoFlow, Gemini'ı güçlü ve doğal dil odaklı bir aracı olarak entegre ederek fiziksel engelli kullanıcıların bilgisayar kullanımını ve bilgisayarla gezinmeyi kolaylaştırmak için tasarlanmış bir sesli erişilebilirlik asistanıdır.

Gemini, 3 aracımızın beyni olarak işlev görür.
### Planlama aracısı
Planlama aracısı, kullanıcı arayüzü öğesi ve ekran görüntüsünden plan oluşturmaktan sorumludur; kullanıcı arayüzü öğesi Win32 UIAutomation API'den, ekran görüntüsü ise Win32 User API'den alınır ve Gemini'dan bu verilerden bir plan oluşturmasını ister.
Bu temsilcinin yalnızca planı yürütme işlevi vardır ve halka planlama sistemine iletir.

### Temsilciyi belirleyin
Aracı tanımlama aracı, kullanıcının etkileşim kurmak istediği düğme veya bağlantılar gibi kullanıcı arayüzü öğelerini tanımlamaktan sorumludur. Bu aracı, kullanıcının etkileşim kurmak istediği öğeyi tanımlamak için Gemini'ı kullanır.

### Gezinme aracısı
Gezinme aracısı, ekranla etkileşimde bulunmak için fare ve klavye etkinliğini yürütmekten sorumludur. Bu aracı, Gemini'ı "sol tıklama" gibi doğal dili fare ve klavye yürütmesine dönüştürmek için kullanır.

Aşağıdakilerle tasarlandı:

  • Google Speech-to-Text (STT)

Takım

Değişikliği yapan

AutoFlow

Nereden

Tayland