SecondEye

आपके लिए इंटरैक्टिव और सिखाने लायक विज़ुअल असिस्टेंट

यह क्या करता है

SecondEye एक इंटरैक्टिव और विज़ुअल असिस्टेंट है. इसे सिखाया जा सकता है. इसका इस्तेमाल, विज़न से जुड़े कई कामों और इस्तेमाल के उदाहरणों के लिए किया जा सकता है. इसे ट्रेनिंग या प्रोग्रामिंग के बिना, अपनी पसंद के मुताबिक विज़न टास्क करने के लिए भी सिखाया जा सकता है. यह पूरी प्रोसेस इंटरैक्टिव और बार-बार होने वाली होती है.
फ़िलहाल, SecondEye को सिर्फ़ Gemini की मदद से बनाया जा सकता है. इसकी वजह यह है कि इस मॉडल में ये खास सुविधाएं हैं:
1. ऑब्जेक्ट का पता लगाने की सुविधा, जिसमें बॉर्डर बॉक्स की सटीक जगहों की जानकारी मिलती है
2. नेटिव वीडियो के लिए, टाइमस्टैंप की जानकारी दिखाने की सुविधा
3. बड़ी कॉन्टेक्स्ट विंडो
SecondEye इन सुविधाओं का इस्तेमाल करके, एआई के इन यूनीक और बिलकुल नए अनुभवों को उपलब्ध कराता है:
• इमेज के लिए (पहली सुविधा का इस्तेमाल करके):
◦ एनोटेट किए गए ऑब्जेक्ट की परिभाषाएं
◦ किसी इमेज के किसी खास हिस्से के बारे में पूछना
◦ बेहतर बनाने के लिए:
▪ ऑब्जेक्ट खोजने की सुविधा
▪ सवालों को ठीक करने या इकट्ठा करने का तरीका
▪ विज़ुअल फ़ीडबैक के अनुरोध
◦ मॉडल को किसी इमेज के एनोटेट किए गए हिस्से के बारे में बताना
• वीडियो के लिए (दूसरी सुविधा का इस्तेमाल करके):
◦ वीडियो खोजने का बेहतर अनुभव
• लाइव कैमरा वीडियो के लिए (तीसरी सुविधा का इस्तेमाल करके):
◦ रीयल-टाइम में वीडियो का विश्लेषण, उपयोगकर्ता के हिसाब से
◦ मॉडल को वीडियो की मदद से कुछ सिखाना
◦ जिन लोगों की आंखों की रोशनी कम है उनके लिए रीयल-टाइम में विज़ुअल सहायता. इसमें, आने वाले समय में पहचानने के लिए चेहरे, ऑब्जेक्ट, और जगहों की जानकारी सेव की जाती है.
• लाइव स्क्रीन शेयर करने के लिए (तीसरी सुविधा का इस्तेमाल करके):
◦ मॉडल को वर्कफ़्लो सिखाना
◦ आईटी या प्रोग्रामिंग से जुड़ी सहायता.
◦ दृष्टि से कमज़ोर लोगों के लिए, वेब ब्राउज़िंग और कंप्यूटर इस्तेमाल करने का सामान्य अनुभव बेहतर बनाना

इनकी मदद से बनाया गया

  • वेब/Chrome
  • Firebase
  • Firebase Genkit
  • बोली को टेक्स्ट में बदलने वाली Google की सुविधा/टेक्स्ट को बोली में बदलने वाली Google की सुविधा

टीम

इन्होंने बदलाव किया है

ज़ाकरिया कद्दारी

इन्होंने भेजा

मोरक्को