शेयर करें

11 दिसंबर, 2024

Gemini, tldraw की "नेचुरल लैंग्वेज कंप्यूटिंग" सुविधा को बेहतर बनाता है

विशाल धर्माधिकारी

प्रॉडक्ट सॉल्यूशंस इंजीनियर

स्टीव रुइज़

Tldraw

Tldraw showcase hero

Gemini API की मदद से, सामान्य भाषा में बातचीत करने की सुविधा को अनलॉक करना

Gemini API की मदद से डेवलपर, एआई की बेहतर सुविधाओं को अपने ऐप्लिकेशन में आसानी से इंटिग्रेट कर सकते हैं. इससे, उपयोगकर्ताओं को बेहतर अनुभव मिलता है और ऐप्लिकेशन की परफ़ॉर्मेंस भी बेहतर होती है. इस पोस्ट में बताया गया है कि tldraw, अपने नए प्रोजेक्ट computer में "नैचुरल लैंग्वेज कंप्यूटिंग" की सुविधा को बेहतर बनाने के लिए, Gemini का इस्तेमाल कैसे करता है. इससे पता चलता है कि स्टार्टअप, Gemini API और tldraw के कैनवस एसडीके का इस्तेमाल करके, कितनी आसानी से और कितनी तेज़ी से एआई को इंटिग्रेट कर सकते हैं. tldraw टीम, जल्द ही Gemini 1.5 Flash के साथ कंप्यूटर लॉन्च करने वाली है (वेटलिस्ट में शामिल हों). फ़िलहाल, यह टीम Gemini 2.0 Flash के साथ प्रोटोटाइप बना रही है, ताकि आने वाले समय में इसे बेहतर बनाया जा सके.

tldraw, Gemini API का इस्तेमाल करके विज़ुअल प्रोग्रामिंग में बातचीत वाले एआई की सुविधा उपलब्ध करा रहा है. इससे उपयोगकर्ता, नैचुरल लैंग्वेज का इस्तेमाल करके कॉन्टेंट जनरेट कर सकते हैं और जानकारी प्रोसेस कर सकते हैं. इससे एआई के साथ ज़्यादा सहज और असरदार तरीके से इंटरैक्ट करने के नए अवसर मिलते हैं. साथ ही, विज़ुअल कम्यूनिकेशन की सीमाओं को आगे बढ़ाया जा सकता है.

कंप्यूटर के पीछे का विज़न

tldraw का मकसद, डायग्राम बनाने की सुविधा को आसान और सहज बनाना है. इसलिए, उसने उपयोगकर्ताओं के लिए कैनवस से इंटरैक्ट करने का एक ज़्यादा सहज तरीका तैयार किया है. संस्थापक स्टीव रुइज़ ने tldraw के इनफ़िनिट कैनवस एसडीके की मदद से, जनरेटिव एआई के साथ काम करने के लिए डाइनैमिक एनवायरमेंट बनाया. इसी विज़न के तहत, computer को बनाया गया है. यह एक एक्सपेरिमेंटल ऐप्लिकेशन है. इसमें उपयोगकर्ता, टेक्स्ट, इमेज, और निर्देशों के ब्लॉक से वर्कफ़्लो बनाते हैं. जब कोई वर्कफ़्लो चलता है, तो जानकारी एक कॉम्पोनेंट से दूसरे कॉम्पोनेंट में जाती है. हर जनरेशन का आउटपुट, अगले जनरेशन के लिए इनपुट के तौर पर काम करता है. इससे ऐसी प्रोसेस बनती हैं जो आउटपुट जनरेट करने के लिए, ब्रांच, लूप, और दोहराव करती हैं.

Gemini 2.0 की मदद से बनाना: कंप्यूटर के बारे में ज़्यादा जानकारी

tldraw का कंप्यूटर, आपस में जुड़े “कॉम्पोनेंट” के नेटवर्क पर बनाया गया है. ये कॉम्पोनेंट, कैनवस पर मौजूद एलिमेंट (टेक्स्ट बॉक्स, इमेज, ऑडियो क्लिप वगैरह) को दिखाते हैं. इन कॉम्पोनेंट को ऐरो से लिंक किया जाता है. इससे डेटा के फ़्लो और ट्रांसफ़ॉर्मेशन को विज़ुअलाइज़ किया जाता है. हर कॉम्पोनेंट से जुड़ी "प्रोसीजर" होती हैं. ये निर्देशों के ऐसे सेट होते हैं जिन्हें कनेक्ट किए गए कॉम्पोनेंट से मिले इनपुट के आधार पर लागू किया जाता है. कोई कॉम्पोनेंट, किसी भी संख्या में अन्य कॉम्पोनेंट से डेटा स्वीकार कर सकता है. साथ ही, अपने आउटपुट डेटा को कई अन्य कॉम्पोनेंट को भेज सकता है. इसमें खुद का डेटा भी शामिल है! कॉम्पोनेंट पर आधारित इस आर्किटेक्चर को Gemini 2.0 Flash की क्षमता और तेज़ी के साथ जोड़ा गया है. इससे एक ऐसा सिस्टम तैयार होता है जो अलग-अलग कामों को तेज़ी से और आसानी से पूरा कर सकता है.

tldraw कंप्यूटर के एआई की मदद से विज़ुअल प्रोग्रामिंग की जा रही है. इसमें Gemini 2.0 का इस्तेमाल करके टेक्स्ट जनरेट किया जा रहा है. साथ ही, इमेज जनरेट करने वाले मॉडल का इस्तेमाल करके इमेज जनरेट की जा रही है

Gemini 2.0 Flash की प्रोटोटाइपिंग ने इस सुविधा को बेहतर बनाने में कैसे मदद की है, यहां बताया गया है:


  • तेज़ी से काम करने की क्षमता: Gemini 2.0 Flash, निर्देशों को तेज़ी से पूरा करता है. उदाहरण के लिए, "निर्देश" कॉम्पोनेंट में "एक छोटा कमर्शियल लिखो" शामिल हो सकता है. ट्रिगर होने के कुछ ही समय बाद, कॉम्पोनेंट ऐसे चरणों की स्क्रिप्ट जनरेट करेगा जिसका दोबारा इस्तेमाल किया जा सकता है. इससे इनपुट के किसी भी कॉम्बिनेशन को कमर्शियल स्क्रिप्ट में बदला जा सकता है. इसके बाद, यह कॉम्पोनेंट इस स्क्रिप्ट का इस्तेमाल करेगा. साथ ही, मौजूदा इनपुट (जैसे, "बिल्लियों के लिए एआई की मदद से काम करने वाले नए स्मार्टग्लोव" के साथ "टेक्स्ट" कॉम्पोनेंट) का इस्तेमाल करके, मॉडल को दूसरा प्रॉम्प्ट देगा, ताकि वह फ़ाइनल आउटपुट दे सके. इस आउटपुट को डिसप्ले के लिए, लिंक किए गए किसी दूसरे "टेक्स्ट" कॉम्पोनेंट को भेजा जा सकता है. साथ ही, इसे कनेक्ट किए गए अन्य कॉम्पोनेंट को भी भेजा जा सकता है. जैसे, टेक्स्ट को बोली में बदलने के लिए "स्पीच", विज़ुअल जनरेट करने के लिए "इमेज" या आगे की प्रोसेस के लिए अन्य “निर्देश” कॉम्पोनेंट.

  • ढेर सारा कॉन्टेक्स्ट, कई मोड: tldraw के कंप्यूटर में ज़्यादा से ज़्यादा जानकारी देने के लिए, तेज़ स्पीड, ज़्यादा क्षमता, और बेहतर परफ़ॉर्मेंस की ज़रूरत होती है. हर जनरेशन के लिए कई कॉम्पोनेंट डेटा उपलब्ध कराते हैं. इसलिए, Gemini 2.0 Flash की बड़ी कॉन्टेक्स्ट विंडो, ऐसे आउटपुट जनरेट करने के लिए ज़रूरी थी जिनमें सभी इनपुट को ध्यान में रखा गया हो. साथ ही, लिखित प्रॉम्प्ट के साथ-साथ इमेज और फ़ाइलों के लिए भी इसकी सहायता ज़रूरी थी.

  • स्ट्रक्चर्ड डेटा: एक ही स्कीमा का इस्तेमाल किए बिना, कॉम्पोनेंट के बीच डेटा ट्रांसफ़र नहीं किया जा सकता. Gemini 2.0 Flash से मिलने वाला स्ट्रक्चर्ड JSON आउटपुट यह पक्का करता है कि वर्कफ़्लो में मौजूद हर कॉम्पोनेंट, किसी भी तरह के डेटा को पहचान सके. साथ ही, उसी स्ट्रक्चर में अपने आउटपुट जनरेट कर सके. इससे, वर्कफ़्लो के रुकने की समस्या नहीं होती और यह आसानी से काम करता है. साथ ही, यह पक्का होता है कि बड़े वर्कफ़्लो भी भरोसेमंद तरीके से पूरे हो सकें.

  • डाइनैमिक तरीके से प्रोसेस जनरेट करना: Gemini 2.0 Flash, पहले से तय की गई प्रोसेस को पूरा करने के साथ-साथ, डाइनैमिक तरीके से प्रोसेस जनरेट कर सकता है. कोई उपयोगकर्ता "इस प्रॉडक्ट के ब्यौरे के आधार पर मार्केटिंग कैंपेन बनाओ" प्रॉम्प्ट डाल सकता है. इसके बाद, Gemini 2.0 Flash ज़रूरी चरणों (प्रक्रियाओं) और कॉम्पोनेंट को जनरेट करेगा. साथ ही, उपयोगकर्ता के अनुरोध के आधार पर कैनवस पर वर्कफ़्लो बनाएगा. डेटा के हिसाब से कॉन्टेंट अपने-आप जनरेट होने की सुविधा से, उपयोगकर्ताओं को बेहतर अनुभव मिलता है और काम करने का तरीका आसान हो जाता है.

इनोवेशन के लिए क्विक विन

tldraw में कंप्यूटर हाइलाइट की सुविधा को तुरंत लागू किया गया है. इससे स्टार्टअप के लिए Gemini की वैल्यू प्रपोज़िशन का पता चलता है: तेज़ी से प्रोटोटाइप बनाना, नैचुरल लैंग्वेज इंटरफ़ेस के ज़रिए बेहतर यूज़र एक्सपीरियंस देना, और Gemini 2.0 Flash जैसे मॉडल की मदद से स्ट्रक्चर्ड डेटा को बेहतर तरीके से मैनेज करना. इस कॉम्बिनेशन की मदद से, छोटी टीमें एआई की मदद से काम करने वाली नई सुविधाओं को कम समय और कम लागत में बना सकती हैं.

“हम यह दिखाना चाहते हैं कि कोई भी टीम, tldraw के कैनवस SDK की मदद से बड़े प्रोजेक्ट बना सकती है. Gemini Flash, तेज़ी से काम करने वाला, मल्टी-मॉडल, और कैनवस पर आधारित वर्कफ़्लो टूल के लिए एक बेहतरीन इंजन था. Gemini 2.0 और शायद एक बेहतर नाम के साथ, हमें पूरा भरोसा है कि हम कल कंप्यूटर को एक स्टार्टअप के तौर पर पेश कर सकते हैं.”

— स्टीव रुइज़, tldraw के फ़ाउंडर

Gemini API की मदद से अपने ऐप्लिकेशन को बेहतर बनाएं

क्या आपको tldraw की सफलता से प्रेरणा मिली है? Gemini API, आपके ऐप्लिकेशन में एआई की नई सुविधाएं जोड़ने के लिए, Gemini 1.5 Pro, Gemini 1.5 Flash, और अब Gemini 2.0 Flash जैसे बेहतरीन मॉडल उपलब्ध कराता है. फ़िलहाल, Gemini 2.0 Flash को एक्सपेरिमेंट के तौर पर उपलब्ध कराया गया है. Gemini API के दस्तावेज़ देखें और अपने उपयोगकर्ताओं को एआई की सुविधाएं उपलब्ध कराएं.

क्रिएटिव पेशेवरों, डेवलपर, और सभी तरह की टीमों के लिए, tldraw एक यूनीक और बेहतरीन प्लैटफ़ॉर्म है. इसकी मदद से, आइडिया को हकीकत में बदला जा सकता है. कंप्यूटर के लिए वेटलिस्ट में शामिल हों. विज़ुअल कोलैबरेशन की नई तकनीक को आज ही आज़माएं.