VISION_AI
Görme engelliler için gezinme deneyiminde devrim yaratıyor.
Ne işe yarar?
Vision_AI, kör bireylere çevrelerine ve ihtiyaçlarına göre anlık sesli geri bildirim ve talimatlar sağlamak için tasarlanmış bir yapay zeka rehberlik sistemidir. Sistem, kapsamlı yardım sunmak için en son üretken yapay zeka ve bilgisayar görüşü teknolojilerinden yararlanarak ortamdaki resimleri ve sesleri yakalayıp işler. Otomatik süreç, gerçek zamanlı engel algılama ve engelleri aşma özelliğinin yanı sıra giyilebilir cihazlarla entegrasyon içerir. Bu sayede, görme engelliler bilgiye ve hizmetlere daha kolay erişirken bağımsız ve güvenli bir şekilde seyahat edebilir. Teknoloji Grubu:
- **RESİM İŞLEME İÇİN ÜRETKEN YAPAY ZEKA (GEMINI)**
- **HTML/CSS**
- **Derinlik Algılama API'si, Konuşma Tanıma API'leri, Metni Konuşmaya Dönüştürme Kitaplıkları**
- **Firebase**
- **ESP32 Modülü Kullanarak Kör Bastonu Entegrasyonu**
- **Akıllı Gözlüklerle Entegrasyon**
**GEMINI API'SİNİ NASIL KULLANDIK?:**
Gemini API, LiDAR ve kamera modüllerinden yapay zeka işleme birimine sürekli olarak sensör verisi aktarılmasını sağlar. Bu sayede VISION_AI, her zaman en güncel çevre bilgilerine erişebilir ve gerçek zamanlı analiz ve yanıt verebilir.
VISION_AI, Gemini API aracılığıyla nesne tanıma ve sahne açıklaması için Google'ın Üretken Yapay Zeka'sını sorunsuz bir şekilde entegre eder. Gemini API, görüntü işleme için görüntü yakalama, ön işleme ve özellik ayıklama gibi temel işlevler sağlar
Geri Bildirim Mekanizmaları:
VISION_AI, Gemini API'nin özelliklerinden yararlanarak kullanıcıya anında işitsel ve dokunsal geri bildirim sağlar.
Aşağıdakilerle tasarlandı:
- Web/Chrome
- Firebase
Takım
Değişikliği yapan
VISION_AI
Nereden
Hindistan