11 دسامبر 2024
تجربه "محاسبات زبان طبیعی" Gemini Powers tldraw
باز کردن تعاملات زبان طبیعی با API Gemini
Gemini API به توسعه دهندگان این امکان را می دهد تا به طور یکپارچه قابلیت های پیشرفته هوش مصنوعی را در برنامه های خود ادغام کنند و امکانات جدیدی را برای تجربه و عملکرد کاربر باز کند. این پست نشان میدهد که چگونه tldraw از Gemini برای ایجاد یک تجربه انقلابی "محاسبات زبان طبیعی" در پروژه جدید خود، رایانه استفاده میکند. این نشان میدهد که استارتآپها میتوانند با استفاده از Gemini API و SDK canvas tldraw، هوش مصنوعی قدرتمند را با سرعت و سهولت ادغام کنند. تیم tldraw به زودی کامپیوتر را با فلش Gemini 1.5 راه اندازی می کند ( به لیست انتظار بپیوندید ) و در حال حاضر در حال نمونه سازی با Gemini 2.0 Flash برای تکرارهای بعدی است.
tldraw از Gemini API استفاده میکند تا قدرت هوش مصنوعی محاورهای را به برنامهنویسی بصری بیاورد و به کاربران امکان میدهد محتوا تولید کنند و اطلاعات را با استفاده از زبان طبیعی پردازش کنند. این فرصتهای هیجانانگیزی را برای تجربه کاربر بصریتر و کارآمدتر در اطراف هوش مصنوعی باز میکند و مرزهای ارتباط بصری را پیش میبرد.
چشم انداز پشت کامپیوتر
tldraw، در تلاش برای قابل دسترس کردن و شهودی کردن نمودارها، روشی طبیعی تری برای تعامل کاربران با بوم خود در نظر گرفت. بنیانگذار استیو رویز به دنبال استفاده از قدرت SDK بوم بی نهایت tldraw برای ایجاد یک محیط پویا برای کار با هوش مصنوعی مولد بود. این دیدگاه منجر به توسعه رایانه شد، یک برنامه آزمایشی که در آن کاربران جریان های کاری را از بلوک های متن، تصاویر و دستورالعمل ها ایجاد می کنند. هنگام اجرا، اطلاعات از یک مؤلفه به مؤلفه بعدی جریان می یابد و خروجی هر نسل به عنوان ورودی برای نسل بعدی عمل می کند و فرآیندهای قدرتمندی را ایجاد می کند که برای تولید خروجی ها شاخه، حلقه و تکرار می شوند.
ساختمان با Gemini 2.0: شیرجه عمیق در کامپیوتر
کامپیوتر tldraw بر روی شبکهای از اجزای به هم پیوسته ساخته شده است که عناصر روی بوم را نشان میدهند (جعبههای متن، تصاویر، کلیپهای صوتی و غیره). این مؤلفهها با فلشهایی به هم مرتبط میشوند و جریان دادهها و تبدیلها را تجسم میکنند. هر مؤلفه دارای «روشهایی» است - مجموعهای از دستورالعملها که بر اساس ورودیهای اجزای متصل اجرا میشوند. یک کامپوننت میتواند دادهها را از هر تعداد مؤلفه دیگر بپذیرد و دادههای خروجی خود را به بسیاری از مؤلفههای دیگر، از جمله خودش، ارسال کند! این معماری مبتنی بر مؤلفه، همراه با قدرت و سرعت فلش Gemini 2.0، امکان ایجاد یک سیستم سریع و انعطاف پذیر را فراهم می کند که قادر به انجام وظایف مختلف است.
در اینجا نحوه نمونه سازی Gemini 2.0 Flash این تجربه را تقویت کرده است:
اجرای روش لایتنینگ سریع: Gemini 2.0 Flash به سرعت رویه ها را اجرا می کند. به عنوان مثال، یک جزء "دستورالعمل" ممکن است حاوی "نوشتن یک تبلیغ کوتاه" باشد. در چند لحظه پس از راه اندازی، مولفه یک اسکریپت قابل استفاده مجدد از مراحل ایجاد می کند که می تواند هر ترکیبی از ورودی ها را به یک اسکریپت تجاری تبدیل کند. سپس مؤلفه از این اسکریپت، همراه با ورودیهای فعلی خود (مثلاً یک مؤلفه «متن» با «دستکش هوشمند جدید با هوش مصنوعی برای گربهها») استفاده میکند تا برای خروجی نهایی آن، درخواست دوم را به مدل بدهد. این خروجی ممکن است به یکی دیگر از مؤلفههای «متن» پیوندی برای نمایش داده شود، و همچنین سایر مؤلفههای متصل، مانند «گفتار» برای تبدیل متن به گفتار، «تصویر» برای تولید بصری، یا سایر مؤلفههای «دستورالعمل» برای تغییر شکل بیشتر.
زمینههای زیاد، حالتهای بسیار: بیشینهگرایی در رایانه tldraw خواستار سرعت، ظرفیت و قابلیت بود. با چندین مؤلفه ارائه دادهها برای هر نسل، پنجره زمینه بزرگ Gemini 2.0 Flash برای تولید خروجیهایی که همه ورودیها را در نظر میگرفت، حیاتی بود، همانطور که پشتیبانی آن از تصاویر و فایلها در کنار درخواستهای نوشته شده بود.
داده های ساختاریافته: جریان داده ها بین مؤلفه ها بدون پایبندی به یک طرح واحد امکان پذیر نخواهد بود. خروجی JSON ساختاریافته Gemini 2.0 Flash تضمین میکند که هر مؤلفه در یک گردش کار میتواند دادهها را از هر نوع تشخیص دهد و خروجیهای خود را در همان ساختار تولید کند، از توقف، هموارسازی اجرا و اطمینان از تکمیل قابل اعتماد گردشهای کاری بزرگ جلوگیری میکند.
تولید رویه پویا: فراتر از اجرای رویه های از پیش تعریف شده، Gemini 2.0 Flash می تواند رویه ها را به صورت پویا تولید کند. کاربر میتواند «ایجاد یک کمپین بازاریابی بر اساس این توضیحات محصول» را وارد کند، و Gemini 2.0 Flash مراحل لازم (رویهها) و اجزای مورد نیاز را ایجاد میکند و یک گردش کار بر روی بوم بر اساس درخواست سطح بالای کاربر ایجاد میکند. این نسل پویا پتانسیل فوقالعادهای را برای تجربههای کاربر نوآورانه و جریانهای کاری کارآمد باز میکند.
یک پیروزی سریع برای نوآوری
پیادهسازی سریع رایانه توسط tldraw ارزش پیشنهادی Gemini را برای استارتآپها برجسته میکند: نمونهسازی سریع، تجربه کاربری پیشرفته از طریق رابطهای زبان طبیعی بصری، و مدیریت کارآمد دادههای ساختاریافته به لطف مدلهایی مانند Gemini 2.0 Flash. این ترکیب به تیمهای کوچک قدرت میدهد تا ویژگیهای خلاقانه و مبتنی بر هوش مصنوعی را سریع و مقرونبهصرفه ایجاد کنند.
ما میخواهیم نشان دهیم که هر تیمی میتواند پروژههای بلندپروازانهای را با SDK canvas tldraw بسازد. Gemini Flash یک موتور عالی برای یک ابزار گردش کار سریع، چند وجهی و مبتنی بر بوم بود. با Gemini 2.0 و شاید نامی بهتر، مطمئنم که فردا میتوانیم رایانه را به عنوان راهاندازی خودش معرفی کنیم.»
برنامه خود را با API Gemini تقویت کنید
از موفقیت tldraw الهام گرفته اید؟ Gemini API مدلهای قدرتمندی مانند Gemini 1.5 Pro، Gemini 1.5 Flash، و اکنون Gemini 2.0 Flash را به عنوان یک مدل پیشنمایش آزمایشی ارائه میکند تا ویژگیهای خلاقانه هوش مصنوعی را به برنامه شما بیاورد. اسناد Gemini API را کاوش کنید و به کاربران خود با هوش مصنوعی قدرت دهید.
برای متخصصان خلاق، توسعه دهندگان و تیم های مختلف، tldraw یک پلت فرم منحصر به فرد و قدرتمند برای زنده کردن ایده ها ارائه می دهد. به لیست انتظار کامپیوتر بپیوندید . آینده همکاری بصری را امروز تجربه کنید.
تونسوترا
استفاده از تواناییهای ترجمه چندزبانه متنی Gemini 2.0 برای دسترسی به کمیکها و وبتونها برای مخاطبان در هند در سراسر زبانهای منطقهای.