توفّر حزمة تطوير البرامج (SDK) لميزة "الاسترجاع العميق" في الذكاء الاصطناعي (AI Edge RAG SDK) المكونات الأساسية لإنشاء مسار عمل "الاسترجاع العميق" باستخدام واجهة برمجة التطبيقات LLM Inference API. توفّر مسار RAG إمكانية وصول نماذج اللغة الكبيرة إلى البيانات المقدَّمة من المستخدِم، والتي يمكن أن تتضمّن معلومات معدَّلة أو حساسة أو خاصة بنطاق معيّن. من خلال إمكانات استرجاع المعلومات المضافة من RAG، يمكن للنماذج اللغوية الكبيرة إنشاء ردود أكثر دقة وأكثر وعيًا بالسياق لحالات استخدام معيّنة.
تتوفّر حزمة تطوير البرامج (SDK) لميزة "المعالجة المحدودة للبيانات في الحافة" من الذكاء الاصطناعي (AI Edge RAG SDK) لنظام التشغيل Android ويمكن تشغيلها بالكامل على الجهاز. ابدأ استخدام حزمة تطوير البرامج (SDK) باتّباع دليل Android الذي يرشدك إلى تنفيذ أساسي لنموذج تطبيق باستخدام RAG.
مسار المراجعة والموافقة
يتضمّن إعداد مسار الإحالة الناجحة لميزة "الاستهداف بالاستناد إلى الجمهور المشابه" باستخدام حزمة SDK لميزة "الاستهداف بالاستناد إلى الجمهور المشابه" في الحافة الذكية للذكاء الاصطناعي الخطوات التالية:
- استيراد البيانات: قدِّم البيانات النصية التي ستستخدمها لغة المحادثة الضخمة عند توليد الإخراج.
- تقسيم البيانات وفهرستها: يمكنك تقسيم البيانات إلى أجزاء صغيرة لفهرستها في قاعدة بيانات.
- إنشاء وحدات تضمين: استخدِم أداة تضمين لتحويل الأجزاء إلى مصفوفات لتخزينها في قاعدة بيانات مصفوفات.
- استرداد المعلومات: حدِّد كيفية تحديد المعلومات ذات الصلة واستردادها للردّ على طلبات المستخدم. بالنسبة إلى طلب معيّن، يبحث عنصر الاسترداد في قاعدة بيانات المتجهات لتحديد المعلوم ات ذات الصلة.
- إنشاء نص باستخدام نموذج لغوي كبير: استخدِم نموذجًا لغويًا كبيرًا لإنشاء ملف ناتج نصي استنادًا إلى المعلومات التي تم استرجاعها من قاعدة بيانات المتجهات.
الوحدات الرئيسية
توفّر حزمة SDK لميزة "المعالجة المحدودة للصور الذكية" (RAG) على الأجهزة الطرفية الوحدات الرئيسية وواجهات برمجة التطبيقات التالية لمسار RAG:
- النماذج اللغوية: نماذج النماذج اللغوية الكبيرة التي تتضمّن واجهة برمجة تطبيقات طلبات مفتوحة، سواء كانت محلية (على الجهاز) أو مستندة إلى الخادم تستند واجهة برمجة التطبيقات إلى واجهة LanguageModel.
- نماذج تضمين النصوص: حوِّل النصوص المنظَّمة وغير المنظَّمة إلى ناقلات تضمين للبحث الدلالي. تستند واجهة برمجة التطبيقات إلى واجهة Embedder.
- مخازن المتجهات: تخزِّن هذه المخازن العناصر المضمّنة والبيانات الوصفية المشتقة من أجزاء البيانات. ويمكن إجراء طلب بحث للحصول على أجزاء مشابهة أو مطابقات تمامة. تستند واجهة برمجة التطبيقات إلى واجهة VectorStore.
- الذاكرة الدلالية: تُستخدَم كسائس دلالي لاسترداد أهم k أجزاء ذات صلة بناءً على طلب بحث. تستند واجهة برمجة التطبيقات إلى واجهة SemanticMemory.
- تقسيم النصوص: يقسم هذا الإجراء بيانات المستخدمين إلى أجزاء أصغر لتسهيل الفهرسة. تستند واجهة برمجة التطبيقات إلى واجهة TextChunker.
توفّر حزمة تطوير البرامج (SDK) سلاسل تجمع عدة مكونات RAG في مسار تدفق واحد. يمكنك استخدام السلاسل لتنسيق نماذج الاسترجاع وطلبات البحث. تستند واجهة برمجة التطبيقات إلى واجهة Chain. للبدء، جرِّب سلسلة استرجاع المعلومات والاستنتاج أو سلسلة استرجاع المعلومات.