مشاركة

11 كانون الأول (ديسمبر) 2024

يوفّر Gemini تجربة "الحوسبة اللغوية الطبيعية" في tldraw

فيشال دارماديكاري

مهندس حلول المنتجات

ستيف رويز

Tldraw

Tldraw showcase hero

الاستفادة من تفاعلات اللغة الطبيعية باستخدام Gemini API

تتيح واجهة برمجة التطبيقات Gemini API للمطوّرين دمج إمكانات الذكاء الاصطناعي المتقدّمة بسلاسة في تطبيقاتهم، ما يفتح آفاقًا جديدة لتجربة المستخدم ووظائفه. تُبرز هذه المشاركة كيفية استخدام tldraw لخدمة Gemini لإنشاء تجربة ثورية في مجال "الحوسبة اللغوية الطبيعية" ضمن مشروعها الجديد computer. يوضّح ذلك السرعة والسهولة التي يمكن للشركات الناشئة من خلالها دمج تقنيات الذكاء الاصطناعي القوية باستخدام Gemini API وحزمة canvas SDK من tldraw. سيطلق فريق tldraw قريبًا أجهزة كمبيوتر تتضمّن Gemini 1.5 Flash (الانضمام إلى قائمة الانتظار)، وهو يعمل حاليًا على إنشاء النماذج الأولية باستخدام Gemini 2.0 Flash للإصدارات المستقبلية.

تستخدم شركة tldraw واجهة برمجة التطبيقات Gemini API لتوفير إمكانات الذكاء الاصطناعي الحواري في البرمجة المرئية، ما يتيح للمستخدمين إنشاء المحتوى ومعالجة المعلومات باستخدام اللغة الطبيعية. ويفتح ذلك فرصًا مثيرة لتوفير تجربة أكثر سهولة وفعالية للمستخدمين في ما يتعلّق بالذكاء الاصطناعي، ما يتجاوز حدود التواصل المرئي.

الرؤية المستنِدة إلى الكمبيوتر

سعى فريق tldraw إلى تسهيل إنشاء المخططات البيانية وجعلها أكثر سهولة، لذلك ابتكر طريقة أكثر طبيعية للمستخدمين للتفاعل مع لوحاتهم. سعى المؤسس "ستيف رويز" إلى الاستفادة من فعالية حزمة SDK الخاصة باللوحة اللامحدودة في tldraw لإنشاء بيئة ديناميكية للعمل مع الذكاء الاصطناعي التوليدي. أدّت هذه الرؤية إلى تطوير computer، وهو تطبيق تجريبي ينشئ فيه المستخدمون سير عمل من مجموعات من النصوص والصور والتعليمات. عند التشغيل، تتدفق المعلومات من مكوّن إلى آخر، ويكون الناتج من كلّ جيل بمثابة إدخال للجيل التالي، ما يؤدي إلى إنشاء عمليات فعّالة تتفرع وتتكرّر وتتكرّر لإنشاء النتائج.

إنشاء تطبيقات باستخدام Gemini 2.0: نظرة معمّقة على Computer

تم إنشاء برنامج tldraw على شبكة من "المكوّنات" المترابطة التي تمثّل العناصر على اللوحة (مربّعات النصوص والصور والمقتطفات الصوتية وما إلى ذلك). يتم ربط هذه المكوّنات بأسهم، ما يوضّح تدفق البيانات والتحويلات. يرتبط كل مكوّن بـ "إجراءات"، وهي مجموعات من التعليمات التي يتم تنفيذها استنادًا إلى المدخلات الواردة من المكوّنات المتصلة. يمكن أن يقبل المكوّن بيانات من أي عدد من المكوّنات الأخرى ويُرسِل بيانات الإخراج إلى العديد من المكوّنات الأخرى، بما في ذلك نفسه. تسمح هذه البنية المستندة إلى المكوّنات، إلى جانب سرعة وفعالية Gemini 2.0 Flash، بتوفير نظام سريع ومرن قادر على معالجة مهام متنوعة.

برمجة مرئية مستندة إلى الذكاء الاصطناعي (AI) على الكمبيوتر باستخدام tldraw مع إنشاء نص باستخدام Gemini 2.0 وإنشاء صور باستخدام نموذج إنشاء صور

في ما يلي كيفية تحسين تجربة Gemini 2.0 Flash من خلال وضع النماذج الأولية:


  • تنفيذ الإجراءات بسرعة البرق: تُنفِّذ ميزة Gemini 2.0 Flash الإجراءات بسرعة. على سبيل المثال، قد يتضمّن مكوّن "تعليمات" عبارة "كتابة إعلان تجاري قصير". بعد لحظات من بدء التنفيذ، سينشئ المكوّن نصًا برمجيًا قابلاً لإعادة الاستخدام يتضمّن خطوات يمكنها تحويل أيّ مجموعة من المدخلات إلى نص برمجي إعلاني. سيستخدم المكوّن بعد ذلك هذا النص البرمجي، بالإضافة إلى مدخلاته الحالية (مثل مكوّن "نص" يتضمّن "قفازات ذكية جديدة تعمل بالذكاء الاصطناعي للقطط")، لإنشاء طلب ثانٍ للنموذج للحصول على النتيجة النهائية. يمكن تمرير هذا الناتج إلى مكوّن "نص" مرتبط آخر للعرض، بالإضافة إلى مكوّنات مرتبطة أخرى، مثل "الخطاب" لتحويل النص إلى كلام، أو "الصورة" لإنشاء المحتوى المرئي، أو مكوّنات "التعليمات" الأخرى لإجراء المزيد من التحويلات.

  • الكثير من السياق، والعديد من الأوضاع: كان التركيز على الأداء الفائق في جهاز tldraw يتطلّب السرعة والسعة والإمكانات. مع توفّر مكونات متعددة تقدّم بيانات لكل جيل، كانت نافذة السياق الكبيرة في Gemini 2.0 Flash ضرورية لإنتاج نتائج تراعي جميع المدخلات، كما كان توفّر الصور والملفات إلى جانب الطلبات المكتوبة ضروريًا أيضًا.

  • البيانات المنظَّمة: لا يمكن تدفق البيانات بين المكوّنات بدون الالتزام بمخطّط واحد. يضمن ناتج JSON المنظَّم من Gemini 2.0 Flash أنّ كل مكوّن في سير العمل يمكنه التعرّف على البيانات من أي نوع وإنشاء نواتج بالبنية نفسها، ما يمنع حدوث توقّفات ويسهّل التنفيذ ويضمن إكمال سير العمل الكبير بشكل موثوق.

  • إنشاء الإجراءات الديناميكية: بالإضافة إلى تنفيذ الإجراءات المحدّدة مسبقًا، يمكن أن ينشئ Gemini 2.0 Flash إجراءات ديناميكيًا. يمكن للمستخدم إدخال "إنشاء حملة تسويقية استنادًا إلى وصف المنتج هذا"، وسينشئ Gemini 2.0 Flash الخطوات (الإجراءات) اللازمة والمكوّنات المطلوبة، ما يؤدي إلى إنشاء سير عمل على اللوحة استنادًا إلى طلب المستخدم العام. توفّر هذه الطريقة الديناميكية إمكانات هائلة لتوفير تجارب مبتكرة للمستخدمين ومسارات عمل سلسة.

تحقيق نتائج سريعة من خلال الابتكار

تُبرز عملية التنفيذ السريعة التي تُجريها شركة tldraw على الكمبيوتر قيمة Gemini المعروضة على الشركات الناشئة، وهي: إنشاء النماذج الأولية بسرعة، وتحسين تجربة المستخدم من خلال واجهات لغة طبيعية سهلة الاستخدام، ومعالجة البيانات المنظَّمة بكفاءة بفضل نماذج مثل Gemini 2.0 Flash. تتيح هذه التركيبة للفرق الصغيرة إنشاء ميزات مبتكرة مستندة إلى الذكاء الاصطناعي بسرعة وبتكلفة معقولة.

"نريد أن نُظهر أنّه يمكن لأي فريق إنشاء مشاريع طموحة باستخدام حزمة SDK لcanvas في tldraw. كان Gemini Flash محرّكًا مثاليًا لأداة سير عمل سريعة ومتعددة الوسائط ومستندة إلى لوحة الرسم. باستخدام Gemini 2.0 وربما اسم أفضل، أنا متأكّد من أنّه يمكننا تقديم الكمبيوتر كشركة ناشئة غدًا".

— ستيف رويز، مؤسس tldraw

تحسين أداء تطبيقك باستخدام Gemini API

هل ألهمك نجاح tldraw؟ توفّر Gemini API نماذج فعّالة، مثل Gemini 1.5 Pro وGemini 1.5 Flash والآن Gemini 2.0 Flash كنموذج تجريبي لمعاينة ميزات الذكاء الاصطناعي المبتكرة في تطبيقك. اطّلِع على مستندات Gemini API ووفِّر للمستخدمين ميزات الذكاء الاصطناعي.

بالنسبة إلى المحترفين المبدعين والمطوّرين والفِرق من جميع الأنواع، يوفّر tldraw منصة فريدة وفعّالة لتحويل الأفكار إلى واقع. الانضمام إلى قائمة انتظار أجهزة الكمبيوتر اختبِر مستقبل التعاون المرئي اليوم.