Visibl
Visibl, ऑडियो बुक को वीडियो बुक में बदलता है
यह क्या करता है
Visibl एक iOS ऐप्लिकेशन है, जो ऑडियो बुक को इमर्सिव वीडियो बुक में बदल देता है. इससे, आपको सुनने का अनुभव विज़ुअल के साथ मिलता है. ऑडियो बुक सुनते समय, Visibl रीयल-टाइम में डाइनैमिक तौर पर इमेज जनरेट करता है. इससे, उपयोगकर्ताओं को ऑडियो बुक के विज़ुअल का एक यूनीक इंटरप्रिटेशन देखने में मदद मिलती है. यह ऐप्लिकेशन सिर्फ़ स्टैटिक इमेज नहीं बनाता. यह उपयोगकर्ताओं को विज़ुअल पर असर डालने और उन्हें निर्देश देने की सुविधा देता है. इससे किताब को पढ़ने का अनुभव ज़्यादा बेहतर बनता है.
Visibl, Gemini API का इस्तेमाल तीन मुख्य तरीकों से करता है:
- ऑडियो ट्रांसक्रिप्ट: यह ऐप्लिकेशन, ऑडियो बुक के ऑडियो को टेक्स्ट में बदल देता है. इससे यह पक्का होता है कि कॉन्टेंट को सही तरीके से दिखाया जा रहा है.
- नेमड इकाई की पहचान (एनईआर): इससे ऐप्लिकेशन, टेक्स्ट में मौजूद मुख्य किरदारों, जगहों, और ऑब्जेक्ट की पहचान कर सकता है और उन पर फ़ोकस कर सकता है. ये ऐसे विज़ुअल जनरेट करने के लिए ज़रूरी हैं जो कॉन्टेक्स्ट के हिसाब से काम के हों (Gemini 1.5 Pro)
- इमेज प्रॉम्प्ट जनरेशन: ट्रांसक्रिप्ट और एनईआर से मिली अहम जानकारी का इस्तेमाल करके, यह ऐप्लिकेशन ज़्यादा जानकारी वाली और उपयोगकर्ताओं के हिसाब से बनाई गई इमेज प्रॉम्प्ट जनरेट करता है. इसके बाद, डिफ़्यूज़न मॉडल का इस्तेमाल करके, रीयल-टाइम में विज़ुअल जनरेट किए जाते हैं. (Gemini 1.5 Pro)
Gemini API की सुविधाओं के इस कॉम्बिनेशन से यह पक्का होता है कि Visibl न सिर्फ़ ऑडियो बुक सुनने का नया तरीका उपलब्ध कराता है, बल्कि हर उपयोगकर्ता को ऑडियो बुक सुनने का एक खास अनुभव भी देता है.
इनकी मदद से बनाया गया
- Firebase
टीम
इन्होंने बदलाव किया है
visibl
इन्होंने भेजा
यूके