VISION_AI

Görme engelliler için gezinme deneyiminde devrim yaratan bir uygulama.

Ne işe yarar?

Vision_AI, kör bireylere çevrelerine ve ihtiyaçlarına göre anlık sesli geri bildirim ve talimatlar sağlamak için tasarlanmış bir yapay zeka rehberlik sistemidir. Sistem, kapsamlı yardım sunmak için en son üretken yapay zeka ve bilgisayar görüşü teknolojilerinden yararlanarak ortamdaki resimleri ve sesleri yakalayıp işler. Otomatik süreç, Gerçek Zamanlı Engel Algılama ve Engelden Kaçınma özelliğinin yanı sıra Giyilebilir Cihazlarla Entegrasyon özelliğini içerir. Bu sayede, görme engelliler bilgi ve hizmetlere daha kolay erişirken bağımsız ve güvenli bir şekilde seyahat edebilir. Teknoloji Grubu:
- **RESİM İŞLEME İÇİN ÜRETKEN YAPAY ZEKA (GEMINI)**
- **HTML/CSS**
- **Derinlik Algılama API'si, Konuşma Tanıma API'leri, Metni Konuşmaya Dönüştürme Kitaplıkları**
- **Firebase**
- **ESP32 Modülü Kullanarak Kör Bastonu Entegrasyonu**
- **Akıllı Gözlüklerle Entegrasyon**
**GEMINI API'SİNİ NASIL KULLANDIK?:**
Gemini API, LiDAR ve kamera modüllerinden yapay zeka işleme birimine sürekli olarak sensör verisi aktarılmasını sağlar. Bu sayede VISION_AI, her zaman en güncel çevre bilgilerine erişebilir ve gerçek zamanlı analiz ve yanıt verebilir.
VISION_AI, Gemini API aracılığıyla nesne tanıma ve sahne açıklaması için Google'ın Üretken Yapay Zeka'sını sorunsuz bir şekilde entegre eder. Gemini API, görüntü işleme için görüntü yakalama, ön işleme ve özellik ayıklama gibi temel işlevler sağlar
Geri Bildirim Mekanizmaları:
Gemini API'nin özelliklerinden yararlanan VISION_AI, kullanıcıya anında işitsel ve dokunsal geri bildirim sağlar.

Aşağıdakilerle tasarlandı:

  • Web/Chrome
  • Firebase

Ekip

Değişikliği yapan

VISION_AI

Nereden

Hindistan