مشاركة

11 كانون الأول (ديسمبر) 2024

يوفّر Gemini تجربة "الحوسبة اللغوية الطبيعية" في tldraw

فيشال دارماديكاري

مهندس حلول المنتجات

ستيف رويز

Tldraw

Tldraw showcase hero

الاستفادة من تفاعلات اللغة الطبيعية باستخدام Gemini API

تتيح واجهة برمجة التطبيقات Gemini API للمطوّرين دمج إمكانات الذكاء الاصطناعي المتقدّمة بسلاسة في تطبيقاتهم، ما يفتح آفاقًا جديدة لتجربة المستخدم ووظائفه. تُبرز هذه المشاركة كيف تستفيد شركة tldraw من Gemini لإنشاء تجربة ثورية في مجال "الحوسبة اللغوية الطبيعية" ضمن مشروعها الجديد computer. يوضّح ذلك السرعة والسهولة التي يمكن للشركات الناشئة من خلالها دمج إمكانات الذكاء الاصطناعي القوية باستخدام Gemini API وحزمة canvas SDK من tldraw. سيطلق فريق tldraw قريبًا تطبيقًا متوافقًا مع Gemini 1.5 Flash (الانضمام إلى قائمة الانتظار)، وهو حاليًا بصدد إنشاء نماذج أولية باستخدام Gemini 2.0 Flash للإصدارات المستقبلية.

تستخدم شركة tldraw واجهة برمجة التطبيقات Gemini API لتوفير إمكانات الذكاء الاصطناعي الحواري في البرمجة المرئية، ما يتيح للمستخدمين إنشاء المحتوى ومعالجة المعلومات باستخدام اللغة الطبيعية. ويفتح ذلك فرصًا مثيرة لتوفير تجربة أكثر سهولة وفعالية للمستخدمين في ما يتعلّق بالذكاء الاصطناعي، ما يتجاوز حدود التواصل المرئي.

الرؤية المستنِدة إلى الكمبيوتر

سعى فريق tldraw إلى تسهيل إنشاء المخططات البيانية وجعلها سهلة الاستخدام، لذلك ابتكر طريقة أكثر طبيعية للمستخدمين للتفاعل مع لوحاتهم. سعى المؤسس "ستيف رويز" إلى الاستفادة من فعالية حزمة تطوير البرامج (SDK) الخاصة باللوحة اللامحدودة في tldraw لإنشاء بيئة ديناميكية للعمل مع الذكاء الاصطناعي التوليدي. أدّت هذه الرؤية إلى تطوير computer، وهو تطبيق تجريبي ينشئ فيه المستخدمون مسارات عمل من مجموعات من النصوص والصور والتعليمات. عند التشغيل، تتدفق المعلومات من مكوّن إلى آخر، ويكون الناتج من كلّ جيل بمثابة إدخال للجيل التالي، ما يؤدي إلى إنشاء عمليات فعّالة تتفرع وتتكرّر وتتكرّر لإنشاء النتائج.

إنشاء نموذج بالاستناد إلى Gemini 2.0: نظرة معمّقة على Computer

تم إنشاء برنامج tldraw على شبكة من "المكوّنات" المترابطة التي تمثّل العناصر على لوحة الرسم (مربّعات النص والصور والمقتطفات الصوتية وما إلى ذلك). يتم ربط هذه المكوّنات بأسهم، ما يوضّح تدفق البيانات والتحويلات. يرتبط كل مكوّن بـ "إجراءات"، وهي مجموعات من التعليمات التي يتم تنفيذها استنادًا إلى المدخلات الواردة من المكوّنات المتصلة. يمكن للمكوّن قبول البيانات من أي عدد من المكوّنات الأخرى ونقل بيانات الإخراج إلى العديد من المكوّنات الأخرى، بما في ذلك نفسه. تسمح هذه البنية المستندة إلى المكوّنات، بالإضافة إلى سرعة وفعالية نموذج 2.0 Flash في Gemini، بإنشاء نظام سريع ومرن قادر على معالجة مهام متنوعة.

برنامج tldraw للبرمجة المرئية بالذكاء الاصطناعي على الكمبيوتر مع إنشاء النصوص باستخدام Gemini 2.0 وإنشاء الصور باستخدام نموذج إنشاء الصور

في ما يلي كيفية تحسين تجربة Gemini من خلال نموذج 2.0 Flash:


  • تنفيذ الإجراءات بسرعة البرق: ينفذ Gemini 2.0 Flash الإجراءات بسرعة. على سبيل المثال، قد يتضمّن مكوّن "تعليمات" عبارة "كتابة إعلان تجاري قصير". بعد لحظات من بدء التنفيذ، سينشئ المكوّن نصًا برمجيًا قابلاً لإعادة الاستخدام يتضمّن خطوات يمكنها تحويل أيّ مجموعة من المدخلات إلى نص برمجي إعلاني. سيستخدم المكوّن بعد ذلك هذا النص البرمجي مع مدخلاته الحالية (مثل مكوّن "نص" يتضمّن "قفازات ذكية جديدة تعمل بالذكاء الاصطناعي للقطط") لتقديم طلب ثانٍ إلى النموذج للحصول على النتيجة النهائية. يمكن تمرير هذا الناتج إلى مكوّن "نص" مرتبط آخر للعرض، بالإضافة إلى مكوّنات مرتبطة أخرى، مثل "الخطاب" لتحويل النص إلى كلام، أو "الصورة" لإنشاء المحتوى المرئي، أو مكوّنات "التعليمات" الأخرى لإجراء المزيد من التحويلات.

  • الكثير من السياق، والعديد من الأوضاع: كان التركيز على الأداء الفائق في جهاز tldraw يتطلّب السرعة والسعة والإمكانات. مع توفّر مكونات متعددة تقدّم بيانات لكل جيل، كانت نافذة السياق الكبيرة في Gemini 2.0 Flash ضرورية لإنتاج نتائج تأخذ جميع المدخلات في الاعتبار، كما كان توفّر الصور والملفات إلى جانب الطلبات المكتوبة ضروريًا أيضًا.

  • البيانات المنظَّمة: لا يمكن تدفق البيانات بين المكوّنات بدون الالتزام بمخطّط واحد. يضمن ناتج JSON المنظَّم من Gemini 2.0 Flash أنّ كل مكوّن في سير العمل يمكنه التعرّف على البيانات من أي نوع وإنشاء نواتج بالبنية نفسها، ما يمنع حدوث توقّفات ويسهّل التنفيذ ويضمن إكمال سير العمل الكبير بشكل موثوق.

  • إنشاء إجراءات ديناميكية: بالإضافة إلى تنفيذ الإجراءات المحدّدة مسبقًا، يمكن لنموذج Gemini 2.0 Flash إنشاء إجراءات ديناميكيًا. يمكن للمستخدم إدخال "إنشاء حملة تسويقية استنادًا إلى وصف المنتج هذا"، وسينشئ Gemini 2.0 Flash الخطوات (الإجراءات) اللازمة والمكوّنات المطلوبة، ما يؤدي إلى إنشاء سير عمل على اللوحة استنادًا إلى طلب المستخدم العالي المستوى. توفّر هذه الطريقة الديناميكية إمكانات هائلة لتوفير تجارب مبتكرة للمستخدمين ومسارات عمل سلسة.

خطوات سريعة للابتكار

تُبرز عملية التنفيذ السريعة لبرنامج tldraw على الكمبيوتر قيمة Gemini المعروضة على الشركات الناشئة، وهي: إنشاء النماذج الأولية بسرعة، وتحسين تجربة المستخدم من خلال واجهات لغة طبيعية سهلة الاستخدام، ومعالجة البيانات المنظَّمة بكفاءة بفضل نماذج مثل Gemini 2.0 Flash. تتيح هذه التركيبة للفرق الصغيرة إنشاء ميزات مبتكرة مستندة إلى الذكاء الاصطناعي بسرعة وبتكلفة معقولة.

"نريد أن نُظهر أنّه يمكن لأي فريق إنشاء مشاريع طموحة باستخدام حزمة SDK لcanvas في tldraw. كان Gemini Flash محرّكًا مثاليًا لإنشاء أداة سير عمل سريعة ومتعدّدة الوسائط ومستندة إلى لوحة الرسم. باستخدام Gemini 2.0 وربما اسم أفضل، أنا متأكّد من أنّه يمكننا تقديم الكمبيوتر كشركة ناشئة غدًا".

— ستيف رويز، مؤسس tldraw

تحسين أداء تطبيقك باستخدام Gemini API

هل ألهمك نجاح tldraw؟ توفّر Gemini API نماذج فعّالة، مثل Gemini 1.5 Pro وGemini 1.5 Flash والآن Gemini 2.0 Flash كنموذج تجريبي لتوفير ميزات مبتكرة للذكاء الاصطناعي في تطبيقك. اطّلِع على مستندات Gemini API ووفِّر للمستخدمين ميزات الذكاء الاصطناعي.

بالنسبة إلى المحترفين المبدعين والمطوّرين والفِرق من جميع الأنواع، يقدّم tldraw منصة فريدة وفعّالة لتحويل الأفكار إلى واقع. الانضمام إلى قائمة انتظار أجهزة الكمبيوتر يمكنك تجربة مستقبل التعاون المرئي اليوم.