VisionAid
एआई की मदद से, दृष्टिबाधित लोगों को दुनिया को नेविगेट करने में मदद करना.
यह क्या करता है
VisionAid एक नया मोबाइल ऐप्लिकेशन है. इसे ऐसे डिज़ाइन किया गया है कि इससे नेत्रहीन लोग अपने आस-पास की जगहों को नेविगेट कर सकें और उनसे इंटरैक्ट कर सकें. यह ऐप्लिकेशन, Google के Gemini 1.5 Flash मॉडल का इस्तेमाल करके इमेज लेता है और उन्हें Gemini को भेजता है. इससे, उपयोगकर्ताओं को रोज़मर्रा के ऑब्जेक्ट की पहचान करने, सार्वजनिक जगहों पर जाने, और अपने जान-पहचान के लोगों और पालतू जानवरों की पहचान करने में मदद मिलती है. साथ ही, वे ज़्यादा आसानी से और स्वतंत्र तरीके से काम कर पाते हैं.
VisionAid के आसान इंटरफ़ेस की मदद से, उपयोगकर्ता अपने आस-पास की चीज़ों के बारे में आसानी से सवाल पूछ सकते हैं. साथ ही, Gemini Flash मॉडल और Google Cloud के Text-To-Speech API की मदद से, उन्हें तुरंत और सटीक जवाब मिलते हैं. VisionAid, एक बेहतरीन साथी की तरह काम करता है. चाहे किराने की दुकान में सामान की पहचान करना हो, व्यस्त सड़क को सुरक्षित तरीके से पार करना हो या किसी दोस्त को पहचानना हो, यह ऐप्लिकेशन लोगों को दुनिया को अपनी शर्तों के मुताबिक एक्सप्लोर करने का भरोसा देता है.
VisionAid का मकसद, दृष्टिबाधित लोगों के लिए दुनिया को ज़्यादा सुलभ बनाना है. इसके लिए, यह ऐप्लिकेशन बेहतरीन टेक्नोलॉजी का इस्तेमाल करता है, ताकि वे अपने दैनिक जीवन में ज़्यादा आत्मनिर्भर बन सकें. VisionAid सिर्फ़ एक ऐप्लिकेशन नहीं है. यह आने वाले समय में एक ऐसी सुविधा के तौर पर काम करेगा जिससे सभी लोग अपने आस-पास की चीज़ों को साफ़ तौर पर और भरोसे के साथ देख पाएंगे. ऐसा एपीआई की तेज़ी से हो रही तरक्की की वजह से होगा.
इनकी मदद से बनाया गया
- Google Cloud का टेक्स्ट-टू-स्पीच (लिखाई को बोली में बदलने की सुविधा)
टीम
इन्होंने भेजा
जर्मनी