مشاركة

‫11 ديسمبر 2024

‫Gemini يتيح تجربة "الحوسبة باللغة الطبيعية" في tldraw

فيشال دارماديكاري

مهندس حلول المنتجات

ستيف رويز

Tldraw

Tldraw showcase hero

إتاحة التفاعلات باللغة الطبيعية باستخدام Gemini API

تتيح Gemini API للمطوّرين دمج إمكانات الذكاء الاصطناعي المتقدّمة بسلاسة في تطبيقاتهم، ما يفتح آفاقًا جديدة لتجربة المستخدم ووظائف التطبيقات. توضّح هذه المشاركة كيف تستفيد tldraw من Gemini لإنشاء تجربة ثورية في "الحوسبة باللغة الطبيعية" ضمن مشروعها الجديد computer. يوضّح هذا المثال السرعة والسهولة التي يمكن للشركات الناشئة من خلالها دمج الذكاء الاصطناعي الفعّال باستخدام Gemini API وحزمة تطوير البرامج (SDK) الخاصة بلوحة العرض في tldraw. سيطلق فريق tldraw قريبًا تطبيق computer باستخدام Gemini 1.5 Flash (يمكنك الانضمام إلى قائمة الانتظار)، ويختبر حاليًا Gemini 2.0 Flash لإصدارات مستقبلية.

تستخدم منصة tldraw واجهة Gemini API للاستفادة من إمكانات الذكاء الاصطناعي الحواري في البرمجة المرئية، ما يتيح للمستخدمين إنشاء المحتوى ومعالجة المعلومات باستخدام اللغة الطبيعية. يفتح هذا التحديث فرصًا مثيرة لتقديم تجربة مستخدم أكثر سهولة وفعالية في ما يتعلّق بالذكاء الاصطناعي، ما يدفع حدود التواصل المرئي إلى آفاق جديدة.

الرؤية من وراء الكمبيوتر

سعت أداة tldraw إلى تسهيل عملية إنشاء المخططات وجعلها أكثر سلاسة، وتصوّرت طريقة أكثر طبيعية ليتفاعل المستخدمون من خلالها مع لوحة العرض. سعى المؤسس "ستيف رويز" إلى الاستفادة من إمكانات حزمة تطوير البرامج (SDK) الخاصة بلوحة tldraw اللانهائية لإنشاء بيئة ديناميكية للعمل باستخدام الذكاء الاصطناعي التوليدي. أدت هذه الرؤية إلى تطوير computer، وهو تطبيق تجريبي يتيح للمستخدمين إنشاء سير عمل من مربّعات النصوص والصور والتعليمات. عند تشغيلها، تنتقل المعلومات من مكوّن إلى آخر، وتكون نتيجة كل عملية إنشاء هي المدخل للعملية التالية، ما يؤدي إلى إنشاء عمليات فعّالة تتفرّع وتتكرّر وتتكرّر لإنتاج النتائج.

الاستفادة من Gemini 2.0: نظرة تفصيلية على علوم الكمبيوتر

تم إنشاء كمبيوتر tldraw استنادًا إلى شبكة من "المكوّنات" المترابطة التي تمثّل العناصر على لوحة العرض (مربّعات النصوص والصور ومقاطع الصوت وما إلى ذلك). يتم ربط هذه المكوّنات بواسطة أسهم، ما يوضّح تدفّق البيانات وعمليات التحويل. يتضمّن كل مكوّن "إجراءات" مرتبطة به، وهي مجموعات من التعليمات التي يتم تنفيذها استنادًا إلى المدخلات من المكوّنات المتصلة. يمكن لأحد المكوّنات قبول البيانات من أي عدد من المكوّنات الأخرى وتمرير بيانات الإخراج إلى العديد من المكوّنات الأخرى، بما في ذلك المكوّن نفسه. تتيح هذه البنية المستندة إلى المكوّنات، إلى جانب قوة وسرعة نموذج Gemini 2.0 Flash، نظامًا سريعًا ومرنًا قادرًا على التعامل مع مهام متنوعة.

‫tldraw computer: برمجة مرئية بالذكاء الاصطناعي مع إنشاء النصوص باستخدام Gemini 2.0 وإنشاء الصور باستخدام نموذج إنشاء الصور

في ما يلي كيف ساهمت النماذج الأولية من ‎2.0 Flash في Gemini في تحسين التجربة:


  • تنفيذ الإجراءات بسرعة فائقة: ينفّذ Gemini 2.0 Flash الإجراءات بسرعة. على سبيل المثال، قد يحتوي مكوّن "التعليمات" على "كتابة إعلان تجاري قصير". في غضون لحظات من تشغيل المكوّن، سينشئ نصًا برمجيًا قابلاً لإعادة الاستخدام يتضمّن خطوات يمكنها تحويل أي مجموعة من المدخلات إلى نص برمجي تجاري. سيستخدم المكوّن بعد ذلك هذا النص البرمجي، بالإضافة إلى مدخلاته الحالية (مثل مكوّن "نص" مع "قفازات ذكية جديدة تعمل بالذكاء الاصطناعي للقطط")، لإنشاء طلب ثانٍ إلى النموذج للحصول على الناتج النهائي. يمكن تمرير هذا الناتج إلى مكوّن "نص" آخر مرتبط لعرضه، بالإضافة إلى مكوّنات أخرى مرتبطة، مثل "كلام" لتحويل النص إلى كلام، أو "صورة" لإنشاء صور، أو مكوّنات "تعليمات" أخرى لإجراء المزيد من عمليات التحويل.

  • الكثير من السياق، والعديد من الأوضاع: يتطلّب النهج الأقصى في حاسوب tldraw السرعة والسعة والقدرة. بما أنّ ميزة "التفكير السريع" في Gemini 2.0 تستخدم عدة مكوّنات لتوفير البيانات لكل عملية إنشاء، كانت قدرة الاستيعاب الكبيرة ضرورية لإنتاج نتائج تأخذ جميع المدخلات في الاعتبار، كما أنّ إمكانية استخدام الصور والملفات إلى جانب الطلبات المكتوبة كانت ضرورية أيضًا.

  • البيانات المنظَّمة: لا يمكن أن يتم تبادل البيانات بين المكوّنات بدون الالتزام بمخطط واحد. يضمن الناتج المنظَّم بتنسيق JSON من Gemini 2.0 Flash أن يتمكّن كل مكوّن في سير العمل من التعرّف على البيانات من أي نوع وإنتاج مخرجاته في البنية نفسها، ما يمنع حدوث أي توقّف مؤقت ويؤدي إلى تنفيذ سلس ويضمن إكمال حتى عمليات سير العمل الكبيرة بشكل موثوق.

  • إنشاء إجراءات ديناميكية: بالإضافة إلى تنفيذ الإجراءات المحدّدة مسبقًا، يمكن لنموذج ‎2.0 Flash من Gemini إنشاء إجراءات ديناميكية. يمكن للمستخدم إدخال طلب مثل "إنشاء حملة تسويقية استنادًا إلى وصف المنتج هذا"، وسينشئ Gemini 2.0 Flash الخطوات اللازمة (الإجراءات) والمكوّنات المطلوبة، وينشئ سير عمل على لوحة العرض استنادًا إلى طلب المستخدم العام. تتيح هذه الميزة إمكانات هائلة لتوفير تجارب مبتكرة للمستخدمين وتبسيط سير العمل.

إنجاز سريع في مجال الابتكار

إنّ التنفيذ السريع الذي أجرته tldraw يسلّط الضوء على القيمة التي يقدّمها Gemini للشركات الناشئة، وهي: إنشاء نماذج أولية بسرعة، وتحسين تجربة المستخدم من خلال واجهات سهلة الاستخدام بلغة طبيعية، والتعامل بكفاءة مع البيانات المنظَّمة بفضل نماذج مثل Gemini 2.0 Flash. تتيح هذه المجموعة للفرق الصغيرة إنشاء ميزات مبتكرة مستندة إلى الذكاء الاصطناعي بسرعة وبتكلفة مناسبة.

"نريد أن نوضّح أنّ بإمكان أي فريق إنشاء مشاريع طموحة باستخدام حزمة تطوير البرامج (SDK) الخاصة بلوحة العرض tldraw. كان Gemini Flash محركًا مثاليًا لأداة سير عمل سريعة ومتعددة الوسائط تستند إلى لوحة العرض. أنا متأكد من أنّنا سنتمكّن من إطلاق شركة ناشئة جديدة غدًا إذا استخدمنا Gemini 2.0 وربما اسمًا أفضل."

— "ستيف رويز"، مؤسِّس tldraw

تعزيز تطبيقك باستخدام Gemini API

هل استلهمت فكرة تطبيقك من نجاح تطبيق tldraw؟ توفّر Gemini API نماذج قوية، مثل Gemini 1.5 Pro وGemini 1.5 Flash، والآن Gemini 2.0 Flash كنموذج تجريبي لمعاينة الميزات، وذلك بهدف توفير ميزات مبتكرة تعمل بالذكاء الاصطناعي لتطبيقك. استكشِف مستندات Gemini API وقدِّم للمستخدمين إمكانات الذكاء الاصطناعي.

بالنسبة إلى المحترفين المبدعين والمطوّرين والفرق من جميع الأنواع، يوفّر tldraw منصة فريدة وفعّالة لتحويل الأفكار إلى واقع ملموس. الانضمام إلى قائمة انتظار استخدام ميزة "الاستماع الذكي" على الكمبيوتر جرِّب مستقبل التعاون المرئي اليوم.