Kjo faqe është përkthyer nga Cloud Translation API.

VISION_AI

Revolucionues navigimi për personat me shikim të dëmtuar.

Çfarë bën

Vision_AI është një sistem udhëzues i AI i krijuar për t'u ofruar individëve të verbër reagime audio në kohë reale dhe udhëzime bazuar në mjedisin dhe nevojat e tyre. Duke përdorur inteligjencën artificiale dhe vizionin kompjuterik gjenerues të fundit, sistemi kap dhe përpunon imazhe dhe tinguj nga mjedisi për të ofruar ndihmë gjithëpërfshirëse. Procesi i automatizuar përfshin zbulimin dhe shmangien e pengesave në kohë reale, dhe integrimin me pajisjet e veshshme, duke u mundësuar të verbërve të udhëtojnë në mënyrë të pavarur dhe të sigurt, ndërkohë që aksesojnë më lehtë informacionin dhe shërbimet. Stack teknologjik:
- **Inteligjencë Artificiale Gjenerative (GEMINI) PËR PËRPUNIM IMAGE **
- **HTML/CSS**
- **API-ja e ndjeshmërisë së thellësisë, API-të e njohjes së të folurit, bibliotekat e tekstit në të folur**
- **Firebase**
- ** Integrimi i shkopit të verbër duke përdorur modulin ESP32 **
- **Integrimi me syze inteligjente**
**SI E PËRDORIM API-në GEMINI:**
Gemini API mundëson transmetimin e vazhdueshëm të të dhënave të sensorëve nga LiDAR dhe modulet e kamerës në njësinë e përpunimit të AI. Kjo siguron që VISION_AI të ketë gjithmonë akses në informacionin më të fundit mjedisor, duke lejuar analiza dhe përgjigje në kohë reale.
Nëpërmjet Gemini API, VISION_AI integron pa probleme AI gjeneruese të Google për njohjen e objekteve dhe përshkrimin e skenës. Gemini API ofron funksione thelbësore për përpunimin e imazhit, të tilla si kapja e imazhit, parapërpunimi dhe nxjerrja e veçorive
Mekanizmat e reagimit:
Duke shfrytëzuar aftësitë e Gemini API, VISION_AI i jep përdoruesit reagime të menjëhershme dëgjimore dhe prekëse.

E ndertuar me

Web/Chrome
Firebase

Ekipi

Nga

VISION_AI

Nga

India