دليل RAG لميزة الذكاء الاصطناعي (AI) على الأجهزة الطرفية

توفّر حزمة تطوير البرامج (SDK) الخاصة بـ AI Edge RAG المكوّنات الأساسية لإنشاء مسار "التوليد المعزّز بالاسترجاع" (RAG) باستخدام LLM Inference API. توفّر عملية التوليد المعزّز بالاسترجاع للنماذج اللغوية الكبيرة إمكانية الوصول إلى البيانات التي يقدّمها المستخدمون، والتي يمكن أن تتضمّن معلومات معدَّلة أو حساسة أو خاصة بمجال معيّن. بفضل إمكانات استرجاع المعلومات الإضافية التي يوفّرها التوليد المعزّز بالاسترجاع، يمكن للنماذج اللغوية الكبيرة إنشاء ردود أكثر دقة وملاءمةً للسياق في حالات استخدام محدّدة.

تتوفّر حزمة تطوير البرامج (SDK) الخاصة بميزة "الاسترجاع المستند إلى البحث" (RAG) من AI Edge على Android ويمكن تشغيلها بالكامل على الجهاز. ابدأ استخدام حزمة تطوير البرامج (SDK) باتّباع دليل Android، الذي يقدّم لك خطوات التنفيذ الأساسية لتطبيق نموذجي باستخدام RAG.

مسار RAG

يتضمّن إعداد مسار RAG باستخدام حزمة تطوير البرامج (SDK) الخاصة بـ AI Edge RAG الخطوات الرئيسية التالية:

  1. استيراد البيانات: أدخِل البيانات النصية التي سيستخدمها النموذج اللغوي الكبير عند إنشاء الناتج.
  2. تقسيم البيانات وفهرستها: قسِّم البيانات إلى أجزاء صغيرة لفهرستها في قاعدة بيانات.
  3. إنشاء التضمينات: استخدِم أداة تضمين لتحويل الأجزاء إلى متّجهات وتخزينها في قاعدة بيانات متّجهات.
  4. استرداد المعلومات: حدِّد كيفية التعرّف على المعلومات ذات الصلة واستردادها للردّ على طلبات المستخدمين. بالنسبة إلى طلب معيّن، يبحث مكوّن الاسترجاع في قاعدة بيانات المتّجهات لتحديد المعلومات ذات الصلة.
  5. إنشاء نص باستخدام نموذج لغوي كبير: استخدِم نموذجًا لغويًا كبيرًا لإنشاء نص الإخراج استنادًا إلى المعلومات التي تم استرجاعها من قاعدة بيانات المتّجهات.

الوحدات الرئيسية

توفّر حزمة تطوير البرامج (SDK) الخاصة بـ AI Edge RAG الوحدات الأساسية وواجهات برمجة التطبيقات التالية لخط أنابيب RAG:

  • النماذج اللغوية: هي نماذج لغوية كبيرة (LLM) تتضمّن واجهة برمجة تطبيقات مفتوحة، سواء كانت محلية (على الجهاز) أو مستندة إلى الخادم. تستند واجهة برمجة التطبيقات إلى واجهة LanguageModel.
  • نماذج تضمين النص: تحويل النص المنظَّم وغير المنظَّم إلى متّجهات مضمّنة للبحث الدلالي تستند واجهة برمجة التطبيقات إلى واجهة Embedder.
  • مخازن المتجهات: يخزّن مخزن المتجهات عمليات التضمين والبيانات الوصفية المستمدّة من أجزاء البيانات. ويمكن الاستعلام عنه للحصول على أجزاء مشابهة أو تطابقات تامة. تستند واجهة برمجة التطبيقات إلى واجهة VectorStore.
  • الذاكرة الدلالية: تعمل كأداة استرجاع دلالي لاسترجاع أفضل k من الأجزاء ذات الصلة بطلب البحث. تستند واجهة برمجة التطبيقات إلى واجهة SemanticMemory.
  • تقسيم النص إلى أجزاء: يتم تقسيم بيانات المستخدم إلى أجزاء أصغر لتسهيل الفهرسة. تستند واجهة برمجة التطبيقات إلى واجهة TextChunker.

توفّر حزمة تطوير البرامج (SDK) سلاسل تجمع بين عدة مكونات من RAG في مسار واحد. يمكنك استخدام السلاسل لتنظيم نماذج الاسترجاع والاستعلام. تستند واجهة برمجة التطبيقات إلى واجهة Chain. للبدء، جرِّب سلسلة الاسترجاع والاستدلال أو سلسلة الاسترجاع.