शेयर करें

11 दिसंबर, 2024

Gemini, tldraw की "नेचुरल लैंग्वेज कंप्यूटिंग" सुविधा को बेहतर बनाता है

विशाल धर्माधिकारी

प्रॉडक्ट सॉल्यूशंस इंजीनियर

स्टीव रुइज़

Tldraw

Tldraw showcase hero

Gemini API की मदद से, सामान्य भाषा में बातचीत करने की सुविधा को अनलॉक करना

Gemini API की मदद से डेवलपर, एआई की बेहतर सुविधाओं को अपने ऐप्लिकेशन में आसानी से इंटिग्रेट कर सकते हैं. इससे उपयोगकर्ताओं को बेहतर अनुभव मिलता है और ऐप्लिकेशन की कार्यक्षमता बढ़ती है. इस पोस्ट में बताया गया है कि tldraw, Gemini का इस्तेमाल करके अपने नए प्रोजेक्ट computer में "नैचुरल लैंग्वेज कंप्यूटिंग" की सुविधा कैसे उपलब्ध कराता है. इससे पता चलता है कि स्टार्टअप, Gemini API और tldraw के कैनवस एसडीके का इस्तेमाल करके, कितनी आसानी से और कितनी तेज़ी से एआई को इंटिग्रेट कर सकते हैं. tldraw टीम, जल्द ही Gemini 1.5 Flash के साथ कंप्यूटर लॉन्च करने वाली है (वेटलिस्ट में शामिल हों). फ़िलहाल, यह टीम Gemini 2.0 Flash के साथ प्रोटोटाइप बना रही है, ताकि आने वाले समय में इसे बेहतर बनाया जा सके.

tldraw, Gemini API का इस्तेमाल करके विज़ुअल प्रोग्रामिंग में बातचीत वाले एआई की सुविधा दे रहा है. इससे उपयोगकर्ता, नैचुरल लैंग्वेज का इस्तेमाल करके कॉन्टेंट जनरेट कर सकते हैं और जानकारी प्रोसेस कर सकते हैं. इससे एआई के साथ ज़्यादा सहज और असरदार तरीके से इंटरैक्ट करने के नए अवसर मिलते हैं. साथ ही, विज़ुअल कम्यूनिकेशन की सीमाओं को आगे बढ़ाया जा सकता है.

कंप्यूटर के पीछे का विज़न

tldraw का मकसद, डायग्राम बनाने की सुविधा को आसान और सहज बनाना है. इसलिए, उसने उपयोगकर्ताओं के लिए कैनवस से इंटरैक्ट करने का एक ज़्यादा सहज तरीका तैयार किया है. संस्थापक स्टीव रुइज़ ने tldraw के इनफ़िनिट कैनवस एसडीके की मदद से, जनरेटिव एआई के साथ काम करने के लिए डाइनैमिक एनवायरमेंट बनाया. इसी विज़न के तहत, computer को बनाया गया है. यह एक एक्सपेरिमेंटल ऐप्लिकेशन है. इसमें उपयोगकर्ता, टेक्स्ट, इमेज, और निर्देशों के ब्लॉक से वर्कफ़्लो बनाते हैं. जब कोई वर्कफ़्लो चलता है, तो जानकारी एक कॉम्पोनेंट से दूसरे कॉम्पोनेंट में जाती है. हर जनरेशन का आउटपुट, अगले जनरेशन के लिए इनपुट के तौर पर काम करता है. इससे ऐसी प्रोसेस बनती हैं जो आउटपुट जनरेट करने के लिए, ब्रांच, लूप, और दोहराव करती हैं.

Gemini 2.0 की मदद से बनाना: कंप्यूटर के बारे में ज़्यादा जानकारी

tldraw का कंप्यूटर, आपस में जुड़े “कॉम्पोनेंट” के नेटवर्क पर बनाया गया है. ये कॉम्पोनेंट, कैनवस पर मौजूद एलिमेंट (टेक्स्ट बॉक्स, इमेज, ऑडियो क्लिप वगैरह) को दिखाते हैं. इन कॉम्पोनेंट को ऐरो से लिंक किया जाता है. इससे डेटा के फ़्लो और ट्रांसफ़ॉर्मेशन को विज़ुअलाइज़ किया जाता है. हर कॉम्पोनेंट से जुड़ी "प्रोसीजर" होती हैं. ये निर्देशों के ऐसे सेट होते हैं जिन्हें कनेक्ट किए गए कॉम्पोनेंट से मिले इनपुट के आधार पर लागू किया जाता है. कोई कॉम्पोनेंट, किसी भी संख्या में अन्य कॉम्पोनेंट से डेटा स्वीकार कर सकता है. साथ ही, अपने आउटपुट डेटा को कई अन्य कॉम्पोनेंट को पास कर सकता है. इसमें खुद का कॉम्पोनेंट भी शामिल है! कॉम्पोनेंट पर आधारित आर्किटेक्चर और Gemini 2.0 Flash की क्षमता और तेज़ी की वजह से, यह सिस्टम अलग-अलग तरह के कामों को तेज़ी से और आसानी से पूरा कर सकता है.

tldraw कंप्यूटर के एआई की मदद से विज़ुअल प्रोग्रामिंग की जा रही है. इसमें Gemini 2.0 का इस्तेमाल करके टेक्स्ट जनरेट किया जा रहा है. साथ ही, इमेज जनरेट करने वाले मॉडल का इस्तेमाल करके इमेज जनरेट की जा रही है

Gemini 2.0 Flash की प्रोटोटाइपिंग ने इस सुविधा को बेहतर बनाने में कैसे मदद की है, यहां बताया गया है:


  • तेज़ी से काम करने की क्षमता: Gemini 2.0 Flash, निर्देशों को तेज़ी से पूरा करता है. उदाहरण के लिए, "निर्देश" कॉम्पोनेंट में "एक छोटा विज्ञापन लिखो" शामिल हो सकता है. ट्रिगर होने के कुछ ही समय बाद, कॉम्पोनेंट ऐसे चरणों की स्क्रिप्ट जनरेट करेगा जिसका दोबारा इस्तेमाल किया जा सकता है. इससे इनपुट के किसी भी कॉम्बिनेशन को कमर्शियल स्क्रिप्ट में बदला जा सकता है. इसके बाद, यह कॉम्पोनेंट इस स्क्रिप्ट का इस्तेमाल करेगा. साथ ही, मौजूदा इनपुट (जैसे, "बिल्लियों के लिए एआई की मदद से काम करने वाले नए स्मार्टग्लोव" के साथ "टेक्स्ट" कॉम्पोनेंट) का इस्तेमाल करके, मॉडल को दूसरा प्रॉम्प्ट देगा, ताकि वह फ़ाइनल आउटपुट जनरेट कर सके. इस आउटपुट को डिसप्ले के लिए, लिंक किए गए किसी दूसरे "टेक्स्ट" कॉम्पोनेंट को भेजा जा सकता है. साथ ही, इसे कनेक्ट किए गए अन्य कॉम्पोनेंट को भी भेजा जा सकता है. जैसे, टेक्स्ट को बोली में बदलने के लिए "स्पीच", विज़ुअल जनरेट करने के लिए "इमेज" या आगे की प्रोसेस के लिए अन्य “निर्देश” कॉम्पोनेंट.

  • ढेर सारा कॉन्टेक्स्ट, कई मोड: tldraw के कंप्यूटर में ज़्यादा से ज़्यादा जानकारी देने के लिए, तेज़ स्पीड, ज़्यादा क्षमता, और बेहतर परफ़ॉर्मेंस की ज़रूरत होती है. हर जनरेशन के लिए कई कॉम्पोनेंट डेटा उपलब्ध कराते हैं. इसलिए, Gemini 2.0 Flash की बड़ी कॉन्टेक्स्ट विंडो, ऐसे आउटपुट जनरेट करने के लिए ज़रूरी थी जिनमें सभी इनपुट को ध्यान में रखा गया हो. साथ ही, लिखित प्रॉम्प्ट के साथ-साथ इमेज और फ़ाइलों के लिए भी इसकी सहायता ज़रूरी थी.

  • स्ट्रक्चर्ड डेटा: एक ही स्कीमा का इस्तेमाल किए बिना, कॉम्पोनेंट के बीच डेटा ट्रांसफ़र नहीं किया जा सकता. Gemini 2.0 Flash से मिलने वाला स्ट्रक्चर्ड JSON आउटपुट यह पक्का करता है कि वर्कफ़्लो में मौजूद हर कॉम्पोनेंट, किसी भी तरह के डेटा को पहचान सके और उसी स्ट्रक्चर में अपने आउटपुट जनरेट कर सके. इससे वर्कफ़्लो में रुकावटें नहीं आतीं, यह आसानी से काम करता है, और यह पक्का करता है कि बड़े वर्कफ़्लो भी भरोसेमंद तरीके से पूरे हो सकें.

  • डाइनैमिक तरीके से प्रोसेस जनरेट करना: Gemini 2.0 Flash, पहले से तय की गई प्रोसेस को पूरा करने के साथ-साथ, डाइनैमिक तरीके से प्रोसेस जनरेट कर सकता है. कोई उपयोगकर्ता "इस प्रॉडक्ट के ब्यौरे के आधार पर मार्केटिंग कैंपेन बनाओ" प्रॉम्प्ट डाल सकता है. इसके बाद, Gemini 2.0 Flash ज़रूरी चरणों (प्रक्रियाओं) और कॉम्पोनेंट को जनरेट करेगा. साथ ही, उपयोगकर्ता के अनुरोध के आधार पर कैनवस पर वर्कफ़्लो बनाएगा. डेटा के हिसाब से कॉन्टेंट अपने-आप जनरेट होने की सुविधा से, उपयोगकर्ताओं को बेहतर अनुभव मिलता है और काम करने का तरीका आसान हो जाता है.

इनोवेशन के लिए क्विक विन

tldraw में कंप्यूटर विज़न को तुरंत लागू करने से, स्टार्टअप के लिए Gemini की वैल्यू प्रपोज़िशन का पता चलता है: तेज़ी से प्रोटोटाइपिंग, नैचुरल लैंग्वेज इंटरफ़ेस के ज़रिए बेहतर उपयोगकर्ता अनुभव, और Gemini 2.0 Flash जैसे मॉडल की मदद से स्ट्रक्चर्ड डेटा को बेहतर तरीके से मैनेज करना. इस कॉम्बिनेशन की मदद से, छोटी टीमें एआई की मदद से काम करने वाली नई सुविधाओं को तेज़ी से और कम लागत में बना सकती हैं.

“हम यह दिखाना चाहते हैं कि कोई भी टीम, tldraw के कैनवस SDK की मदद से बड़े प्रोजेक्ट बना सकती है. Gemini Flash, तेज़ी से काम करने वाला, मल्टी-मॉडल, और कैनवस पर आधारित वर्कफ़्लो टूल के लिए एक बेहतरीन इंजन था. Gemini 2.0 और शायद एक बेहतर नाम के साथ, हमें पूरा भरोसा है कि हम कल कंप्यूटर को एक स्टार्टअप के तौर पर पेश कर सकते हैं.”

— स्टीव रुइज़, tldraw के फ़ाउंडर

Gemini API की मदद से अपने ऐप्लिकेशन को बेहतर बनाएं

क्या आपको tldraw की सफलता से प्रेरणा मिली है? Gemini API, आपके ऐप्लिकेशन में एआई की नई सुविधाएं जोड़ने के लिए, Gemini 1.5 Pro, Gemini 1.5 Flash, और अब Gemini 2.0 Flash जैसे बेहतरीन मॉडल उपलब्ध कराता है. फ़िलहाल, Gemini 2.0 Flash को एक्सपेरिमेंट के तौर पर उपलब्ध कराया गया है. Gemini API के दस्तावेज़ देखें और अपने उपयोगकर्ताओं को एआई की सुविधाएं उपलब्ध कराएं.

क्रिएटिव पेशेवरों, डेवलपर, और सभी तरह की टीमों के लिए, tldraw एक यूनीक और बेहतरीन प्लैटफ़ॉर्म है. इसकी मदद से, आइडिया को हकीकत में बदला जा सकता है. कंप्यूटर के लिए वेटलिस्ट में शामिल हों. विज़ुअल कोलैबरेशन की नई तकनीक को आज ही आज़माएं.