अनुज शर्मा
दुनिया को देखने की सुविधा वाली वॉइस असिस्टेंट
यह क्या करता है
मुझे Google (Gemini) का एपीआई पसंद है, क्योंकि यह बेहतर नतीजे देता है. मुझे Gemini API की मदद से अपना छोटा प्रोजेक्ट बनाना है, इसलिए
मैंने एक ऐसा Python ऐप्लिकेशन या सॉफ़्टवेयर बनाया है जिसका मकसद, एआई या वॉइस असिस्टेंट बनाने का है. फ़िलहाल, ऐसे कई कोड या प्रोजेक्ट हैं जिनमें वॉइस असिस्टेंट, वॉइस के ज़रिए निर्देश लेती हैं और वॉइस में जवाब देती हैं. हालांकि, वे हमारी क्वेरी को विज़न के तौर पर नहीं देख पाती हैं. इसलिए, मैंने Gemini API (Pro और Vision Pro) की मदद से इस तरह का प्रोजेक्ट बनाया है. अब मेरी वॉइस असिस्टेंट, इमेज के तौर पर इनपुट भी ले सकती है और टेक्स्ट के साथ-साथ वॉइस में भी जवाब दे सकती है
इनकी मदद से बनाया गया
- कोई नहीं
- Firebase
टीम
इन्होंने बदलाव किया है
Kritrim
इन्होंने भेजा
भारत