مشاركة

‫11 ديسمبر 2024

‫Gemini يتيح تجربة "الحوسبة باللغة الطبيعية" في tldraw

فيشال دارماديكاري

مهندس حلول المنتجات

ستيف رويز

Tldraw

Tldraw showcase hero

إتاحة التفاعلات باللغة الطبيعية باستخدام Gemini API

تتيح Gemini API للمطوّرين دمج إمكانات الذكاء الاصطناعي المتقدّمة بسلاسة في تطبيقاتهم، ما يفتح آفاقًا جديدة لتحسين تجربة المستخدم ووظائف التطبيقات. توضّح هذه المشاركة كيف تستفيد tldraw من Gemini لإنشاء تجربة ثورية في "الحوسبة باللغة الطبيعية" ضمن مشروعها الجديد computer. يوضّح هذا المثال السرعة والسهولة التي يمكن للشركات الناشئة من خلالها دمج الذكاء الاصطناعي الفعّال باستخدام Gemini API وحزمة تطوير البرامج (SDK) الخاصة بلوحة العرض في tldraw. سيطلق فريق tldraw قريبًا تطبيق computer المزوّد بنموذج Gemini 1.5 Flash (يمكنك الانضمام إلى قائمة الانتظار)، ويختبر حاليًا نموذج Gemini 2.0 Flash لإطلاقه في الإصدارات المستقبلية.

تستخدم منصة tldraw واجهة Gemini API لتوفير إمكانات الذكاء الاصطناعي الحواري في البرمجة المرئية، ما يتيح للمستخدمين إنشاء المحتوى ومعالجة المعلومات باستخدام اللغة الطبيعية. يفتح هذا الإجراء فرصًا مثيرة لتقديم تجربة مستخدم أكثر سهولة وفعالية في ما يتعلّق بالذكاء الاصطناعي، ما يدفع حدود التواصل المرئي إلى آفاق جديدة.

الرؤية وراء الكمبيوتر

سعت tldraw إلى تسهيل عملية إنشاء المخططات وجعلها أكثر سلاسة، وتصوّرت طريقة أكثر طبيعية ليتفاعل المستخدمون من خلالها مع لوحة العرض. سعى المؤسس "ستيف رويز" إلى الاستفادة من إمكانات حزمة تطوير البرامج (SDK) الخاصة بلوحة tldraw اللانهائية لإنشاء بيئة ديناميكية للعمل باستخدام الذكاء الاصطناعي التوليدي. أدّت هذه الرؤية إلى تطوير computer، وهو تطبيق تجريبي يتيح للمستخدمين إنشاء سير عمل من مربّعات النصوص والصور والتعليمات. عند تشغيلها، تنتقل المعلومات من مكوّن إلى آخر، وتكون نتيجة كل عملية إنشاء هي المدخل للعملية التالية، ما يؤدي إلى إنشاء عمليات فعّالة تتفرّع وتتكرّر وتتكرّر لإنتاج النتائج.

الاستفادة من Gemini 2.0: نظرة تفصيلية على علوم الكمبيوتر

تم إنشاء كمبيوتر tldraw استنادًا إلى شبكة من "المكوّنات" المترابطة التي تمثّل العناصر على لوحة العرض (مربّعات النصوص والصور ومقاطع الصوت وما إلى ذلك). يتم ربط هذه المكوّنات بواسطة أسهم، ما يوضّح تدفّق البيانات وعمليات التحويل. يتضمّن كل مكوّن "إجراءات" مرتبطة به، وهي مجموعات من التعليمات التي يتم تنفيذها استنادًا إلى المدخلات من المكوّنات المتصلة. يمكن لأحد المكوّنات قبول البيانات من أي عدد من المكوّنات الأخرى وتمرير بيانات الإخراج إلى العديد من المكوّنات الأخرى، بما في ذلك المكوّن نفسه. تتيح هذه البنية المستندة إلى المكوّنات، بالإضافة إلى إمكانات وسرعة Gemini 2.0 Flash، إنشاء نظام سريع ومرن قادر على التعامل مع مهام متنوعة.

‫tldraw computer: برمجة مرئية بالذكاء الاصطناعي مع إنشاء النصوص باستخدام Gemini 2.0 وإنشاء الصور باستخدام نموذج إنشاء الصور

في ما يلي كيف ساهمت النماذج الأولية من ‎2.0 Flash في Gemini في تحسين التجربة:


  • تنفيذ الإجراءات بسرعة فائقة: ينفّذ Gemini 2.0 Flash الإجراءات بسرعة. على سبيل المثال، قد يحتوي مكوّن "التعليمات" على "كتابة إعلان تجاري قصير". في غضون لحظات من تشغيل المكوّن، سينشئ نصًا برمجيًا قابلاً لإعادة الاستخدام يتضمّن خطوات يمكنها تحويل أي مجموعة من المدخلات إلى نص برمجي تجاري. سيستخدم المكوّن بعد ذلك هذا النص البرمجي، بالإضافة إلى مدخلاته الحالية (مثل مكوّن "نص" مع "قفازات ذكية جديدة تعمل بالذكاء الاصطناعي للقطط")، لإنشاء طلب ثانٍ إلى النموذج للحصول على الناتج النهائي. يمكن تمرير هذا الناتج إلى مكوّن "نص" آخر مرتبط لعرضه، بالإضافة إلى مكوّنات أخرى مرتبطة، مثل "الكلام" لتحويل النص إلى كلام، أو "الصورة" لإنشاء صور، أو مكوّنات "التعليمات" الأخرى لإجراء المزيد من عمليات التحويل.

  • الكثير من السياق، والعديد من الأوضاع: يتطلّب أسلوب التصميم الأقصى في حاسوب tldraw السرعة والسعة والإمكانات. بما أنّ ميزة "التفكير السريع" في Gemini 2.0 تستخدم عدة مكوّنات لتوفير البيانات لكل عملية إنشاء، كانت قدرة الاستيعاب الكبيرة ضرورية لإنتاج نتائج تأخذ جميع المدخلات في الاعتبار، كما أنّ إمكانية استخدام الصور والملفات إلى جانب الطلبات المكتوبة كانت ضرورية أيضًا.

  • البيانات المنظَّمة: لا يمكن أن يتم تدفّق البيانات بين المكوّنات بدون الالتزام بمخطط واحد. يضمن الناتج المنظَّم بتنسيق JSON من Gemini 2.0 Flash أن يتمكّن كل مكوّن في سير العمل من التعرّف على البيانات من أي نوع وإنتاج مخرجاته بالبنية نفسها، ما يمنع حدوث أي توقّف مؤقت ويؤدي إلى تنفيذ سلس ويضمن إكمال حتى أكبر مهام سير العمل بشكل موثوق.

  • إنشاء إجراءات ديناميكية: بالإضافة إلى تنفيذ الإجراءات المحدّدة مسبقًا، يمكن لنموذج ‎2.0 Flash من Gemini إنشاء إجراءات ديناميكية. يمكن للمستخدم إدخال طلب مثل "إنشاء حملة تسويقية استنادًا إلى وصف المنتج هذا"، وسينشئ Gemini 2.0 Flash الخطوات اللازمة (الإجراءات) والمكوّنات المطلوبة، وينشئ سير عمل على لوحة العرض استنادًا إلى طلب المستخدم العام. تتيح هذه الميزة إمكانات هائلة لتوفير تجارب مبتكرة للمستخدمين وتبسيط سير العمل.

إنجاز سريع في مجال الابتكار

إنّ التنفيذ السريع لـ tldraw يسلّط الضوء على القيمة المقترَحة من Gemini للشركات الناشئة، وهي: النماذج الأولية السريعة، وتجربة المستخدم المحسّنة من خلال واجهات اللغة الطبيعية السهلة الاستخدام، والتعامل الفعّال مع البيانات المنظَّمة بفضل نماذج مثل Gemini 2.0 Flash. تتيح هذه المجموعة للفرق الصغيرة إنشاء ميزات مبتكرة مستندة إلى الذكاء الاصطناعي بسرعة وبتكلفة مناسبة.

"نريد أن نوضّح أنّ بإمكان أي فريق إنشاء مشاريع طموحة باستخدام حزمة تطوير البرامج (SDK) الخاصة بلوحة tldraw. كان Gemini Flash محركًا مثاليًا لأداة سير عمل سريعة ومتعددة الوسائط ومستندة إلى لوحة العرض. مع Gemini 2.0 وربما اسم أفضل، أنا متأكد تمامًا من أنّه يمكننا تقديم الكمبيوتر كشركة ناشئة مستقلة غدًا".

— "ستيف رويز"، مؤسِّس tldraw

تعزيز تطبيقك باستخدام Gemini API

هل استلهمت فكرة تطبيقك من نجاح tldraw؟ توفّر Gemini API نماذج قوية، مثل Gemini 1.5 Pro وGemini 1.5 Flash، والآن Gemini 2.0 Flash كنموذج تجريبي لمعاينة الميزات، وذلك بهدف توفير ميزات مبتكرة تعمل بالذكاء الاصطناعي لتطبيقك. استكشِف مستندات Gemini API وقدِّم للمستخدمين إمكانات الذكاء الاصطناعي.

بالنسبة إلى المحترفين المبدعين والمطوّرين والفرق من جميع الأنواع، يوفّر tldraw منصة فريدة وفعّالة لتحويل الأفكار إلى واقع ملموس. الانضمام إلى قائمة انتظار استخدام ميزة "المساعد الذكي" على الكمبيوتر جرِّب مستقبل التعاون المرئي اليوم.