مشاركة

‫11 ديسمبر 2024

‫Gemini يتيح تجربة "الحوسبة باللغة الطبيعية" في tldraw

فيشال دارماذيكاري

مهندس حلول المنتجات

ستيف رويز

Tldraw

Tldraw showcase hero

إتاحة التفاعلات باللغة الطبيعية باستخدام Gemini API

تتيح واجهة برمجة التطبيقات Gemini API للمطوّرين دمج إمكانات الذكاء الاصطناعي المتقدّمة بسلاسة في تطبيقاتهم، ما يفتح آفاقًا جديدة لتجربة المستخدم ووظائف التطبيقات. توضّح هذه المشاركة كيف تستفيد tldraw من Gemini لإنشاء تجربة ثورية في "الحوسبة باللغة الطبيعية" ضمن مشروعها الجديد computer. يوضّح هذا الفيديو السرعة والسهولة التي يمكن للشركات الناشئة من خلالها دمج تكنولوجيات الذكاء الاصطناعي الفعّالة باستخدام Gemini API وحزمة تطوير البرامج (SDK) الخاصة بلوحة العرض من tldraw. سيطلق فريق tldraw قريبًا تطبيق computer المزوّد بنموذج Gemini 1.5 Flash (يمكنك الانضمام إلى قائمة الانتظار)، ويختبر حاليًا نموذج Gemini 2.0 Flash لإطلاقه في الإصدارات المستقبلية.

تستخدم منصة tldraw واجهة Gemini API للاستفادة من إمكانات الذكاء الاصطناعي الحواري في البرمجة المرئية، ما يتيح للمستخدمين إنشاء المحتوى ومعالجة المعلومات باستخدام اللغة الطبيعية. يفتح هذا التحديث آفاقًا جديدة لتجربة مستخدم أكثر سلاسة وفعالية في ما يتعلّق بالذكاء الاصطناعي، ما يدفع حدود التواصل المرئي إلى آفاق جديدة.

الرؤية وراء الكمبيوتر

سعت tldraw إلى تسهيل عملية إنشاء المخططات وجعلها أكثر سلاسة، وتصوّرت طريقة أكثر طبيعية ليتفاعل المستخدمون من خلالها مع لوحة العرض. سعى المؤسس "ستيف رويز" إلى الاستفادة من إمكانات حزمة تطوير البرامج (SDK) الخاصة بلوحة tldraw اللانهائية لإنشاء بيئة ديناميكية للعمل باستخدام الذكاء الاصطناعي التوليدي. أدّت هذه الرؤية إلى تطوير الكمبيوتر، وهو تطبيق تجريبي يتيح للمستخدمين إنشاء سير عمل من مربّعات النصوص والصور والتعليمات. عند تشغيلها، تنتقل المعلومات من مكوّن إلى آخر، وتكون نتيجة كل عملية إنشاء هي المدخل للعملية التالية، ما يؤدي إلى إنشاء عمليات فعّالة تتفرّع وتتكرّر وتتكرّر لإنتاج النتائج.

الاستفادة من Gemini 2.0: نظرة تفصيلية على علوم الكمبيوتر

تم إنشاء كمبيوتر tldraw استنادًا إلى شبكة من "المكوّنات" المترابطة التي تمثّل العناصر على لوحة العرض (مربّعات النصوص والصور ومقاطع الصوت وما إلى ذلك). يتم ربط هذه المكوّنات بأسهم، ما يوضّح تدفّق البيانات وعمليات التحويل. يتضمّن كل مكوّن "إجراءات" مرتبطة به، وهي مجموعات من التعليمات يتم تنفيذها استنادًا إلى المدخلات من المكوّنات المتصلة. يمكن لأحد المكوّنات قبول البيانات من أي عدد من المكوّنات الأخرى وتمرير بيانات الإخراج إلى العديد من المكوّنات الأخرى، بما في ذلك المكوّن نفسه. تتيح هذه البنية المستندة إلى المكوّنات، بالإضافة إلى قوة وسرعة نموذج ‎2.0 Flash في Gemini، إنشاء نظام سريع ومرن قادر على التعامل مع مهام متنوعة.

‫tldraw computer: برمجة مرئية بالذكاء الاصطناعي مع إنشاء النصوص باستخدام Gemini 2.0 وإنشاء الصور باستخدام نموذج إنشاء الصور

في ما يلي كيف ساهمت النماذج الأولية من ‎Gemini 2.0 Flash في تحسين التجربة:


  • تنفيذ الإجراءات بسرعة فائقة: ينفّذ Gemini 2.0 Flash الإجراءات بسرعة. على سبيل المثال، قد يحتوي مكوّن "التعليمات" على "كتابة إعلان تجاري قصير". في غضون لحظات من تشغيل المكوّن، سينشئ نصًا برمجيًا قابلاً لإعادة الاستخدام يتضمّن خطوات يمكنها تحويل أي مجموعة من المدخلات إلى نص برمجي تجاري. سيستخدم المكوّن بعد ذلك هذا النص البرمجي، بالإضافة إلى مدخلاته الحالية (مثل مكوّن "نص" مع "قفازات ذكية جديدة تعمل بالذكاء الاصطناعي للقطط")، لإنشاء طلب ثانٍ إلى النموذج للحصول على الناتج النهائي. يمكن تمرير هذا الناتج إلى مكوّن "نص" آخر مرتبط لعرضه، بالإضافة إلى مكوّنات أخرى مرتبطة، مثل "كلام" لتحويل النص إلى كلام، أو "صورة" لإنشاء صور، أو مكوّنات "تعليمات" أخرى لإجراء المزيد من عمليات التحويل.

  • الكثير من السياق، والعديد من الأوضاع: يتطلّب النهج الأقصى في حاسوب tldraw السرعة والسعة والإمكانات. بما أنّ ميزة "التفكير السريع" في Gemini 2.0 تستخدم عدة مكوّنات لتوفير البيانات لكل عملية إنشاء، كان من الضروري أن تتضمّن قدرة استيعاب كبيرة لإنتاج نتائج تأخذ جميع المدخلات في الاعتبار، كما كان من الضروري أن تتيح استخدام الصور والملفات إلى جانب الطلبات المكتوبة.

  • البيانات المنظَّمة: لا يمكن أن يتم تدفّق البيانات بين المكوّنات بدون الالتزام بمخطط واحد. يضمن ناتج JSON المنظَّم من Gemini 2.0 Flash أن يتمكّن كل مكوّن في سير العمل من التعرّف على البيانات من أي نوع وإنتاج نواتجه في البنية نفسها، ما يمنع حدوث أي توقّف مؤقت ويسهّل التنفيذ ويضمن إكمال حتى عمليات سير العمل الكبيرة بشكل موثوق.

  • إنشاء الإجراءات الديناميكية: بالإضافة إلى تنفيذ الإجراءات المحدّدة مسبقًا، يمكن لنموذج ‎2.0 Flash من Gemini إنشاء الإجراءات بشكل ديناميكي. يمكن للمستخدم إدخال طلب مثل "إنشاء حملة تسويقية استنادًا إلى وصف المنتج هذا"، وسينشئ Gemini 2.0 Flash الخطوات اللازمة (الإجراءات) والمكوّنات المطلوبة، وينشئ سير عمل على لوحة العرض استنادًا إلى طلب المستخدم العام. تتيح هذه الميزة إمكانات هائلة لتقديم تجارب مبتكرة للمستخدمين وتبسيط سير العمل.

إنجاز سريع في مجال الابتكار

إنّ التنفيذ السريع الذي أجرته tldraw يسلّط الضوء على القيمة المقترَحة التي يقدّمها Gemini للشركات الناشئة، وهي: النماذج الأولية السريعة، وتجربة المستخدم المحسّنة من خلال واجهات اللغة الطبيعية السهلة الاستخدام، والتعامل الفعّال مع البيانات المنظَّمة بفضل نماذج مثل Gemini 2.0 Flash. تتيح هذه المجموعة للفرق الصغيرة إنشاء ميزات مبتكرة مستندة إلى الذكاء الاصطناعي بسرعة وبتكلفة مناسبة.

"نريد أن نوضّح أنّ أي فريق يمكنه إنشاء مشاريع طموحة باستخدام حزمة تطوير البرامج (SDK) الخاصة بلوحة الرسم في tldraw. كان Gemini Flash محركًا مثاليًا لأداة سير عمل سريعة ومتعدّدة الوسائط تستند إلى لوحة العرض. مع Gemini 2.0 وربما اسم أفضل، أنا متأكد من أنّه يمكننا تقديم الكمبيوتر كشركة ناشئة مستقلة غدًا".

— "ستيف رويز"، مؤسس tldraw

تعزيز تطبيقك باستخدام Gemini API

هل استلهمت فكرة تطبيقك من نجاح tldraw؟ توفّر Gemini API نماذج قوية، مثل Gemini 1.5 Pro وGemini 1.5 Flash، والآن Gemini 2.0 Flash كنموذج تجريبي مسبق، وذلك لتقديم ميزات مبتكرة تعمل بالذكاء الاصطناعي إلى تطبيقك. استكشِف مستندات Gemini API وقدِّم للمستخدمين إمكانات الذكاء الاصطناعي.

بالنسبة إلى المحترفين المبدعين والمطوّرين والفرق من جميع الأنواع، يوفّر tldraw منصة فريدة وفعّالة لتحويل الأفكار إلى واقع ملموس. الانضمام إلى قائمة انتظار استخدام ميزة "الكمبيوتر" جرِّب مستقبل التعاون المرئي اليوم.