DeepLook
DeepLook, एआई (AI) पर आधारित वीडियो निगरानी और आंकड़े बताने वाला प्लैटफ़ॉर्म है
यह क्या करता है
DeepLook एक नया प्लैटफ़ॉर्म है. इसमें Gemini मॉडल का इस्तेमाल करके, वीडियो निगरानी और आंकड़ों में जनरेटिव एआई की सुविधाएं जोड़ी जाती हैं. इन सुविधाओं में, चैट या वॉइस की मदद से यूज़र इंटरफ़ेस (यूआई) को कंट्रोल करने से लेकर, कैमरों पर वीडियो का बेहतर विश्लेषण करने और इवेंट का पता लगाने की सुविधा शामिल है. DeepLook, सामान्य भाषा का इस्तेमाल करके टास्क पूरा कर सकता है. जैसे, मेन्यू और मुश्किल से मिलने वाले विजेट का इस्तेमाल किए बिना, कैमरे को तुरंत खोलना, रिकॉर्डिंग ऐक्सेस करना, और वीडियो एक्सपोर्ट करना. सबसे अहम बात यह है कि विज़न ऐनलिटिक्स की मदद से, लाइव कैमरों पर सवाल-जवाब किए जा सकते हैं. साथ ही, पिछली रिकॉर्डिंग की खास जानकारी देखी जा सकती है, ऑब्जेक्ट का पता लगाया जा सकता है, और परिवार को यह जानकारी दी जा सकती है कि अकेले रहने वाला व्यक्ति कैसा है. इसके अलावा, यह वाक्य पर आधारित इवेंट भी ट्रिगर कर सकता है, जैसे कि "क्या कोई गिरा है?", "हथियार दिखने पर सूचना दें" या वयस्कों की देखभाल के संदर्भ में स्थिति का विश्लेषण, जैसे कि बुज़ुर्गों की निगरानी करना.
इसके अलावा, DeepLook से रजिस्टर किए गए इवेंट होने पर, उपयोगकर्ताओं को सूचना दी जा सकती है. साथ ही, कैमरों पर मैन्युअल या अपने-आप PTZ मूवमेंट लागू किया जा सकता है. जैसे, कैमरे को तय किए गए फ़्रेम ऑब्जेक्ट पर अपने-आप सेंटर करना.
लागत-फ़ायदे के अनुपात की वजह से, यह सिस्टम मुख्य रूप से Gemini-flash के साथ काम करता है. कमांड को पार्स करने की सुविधा, मुख्य रूप से vertex एआई फ़ंक्शन कॉलिंग पर निर्भर करती है. इमेज का विश्लेषण करने की सुविधा, मॉडल एपीआई को प्रॉम्प्ट के ज़रिए सबमिट किए गए वीडियो स्निपेट और टाइल वाली इमेज मोज़ेक के साथ काम करती है. DeepLook के वेब और Android वर्शन उपलब्ध होंगे. सर्वर, Firebase ऐप्लिकेशन होस्ट और Cloud Run पर चल सकता है. इसके लिए, एक एजेंट का इस्तेमाल किया जाता है, जो कैमरों को स्थानीय तौर पर कनेक्ट करता है. यह एजेंट, कैमरों और सर्वर के बीच ब्रिज के तौर पर काम करता है.
इनकी मदद से बनाया गया
- वेब/Chrome
- Cloud Run
- Google Cloud का इन्फ़्रास्ट्रक्चर
टीम
इन्होंने बदलाव किया है
DeepLook
इन्होंने भेजा
इटली