راهنمای AI Edge RAG

کیت توسعه نرم‌افزاری AI Edge RAG اجزای اساسی برای ساخت یک خط تولید افزوده بازیابی (RAG) با رابط برنامه‌نویسی کاربردی استنتاج LLM را فراهم می‌کند. یک خط تولید RAG به LLMها امکان دسترسی به داده‌های ارائه شده توسط کاربر را می‌دهد که می‌تواند شامل اطلاعات به‌روز، حساس یا خاص دامنه باشد. با قابلیت‌های بازیابی اطلاعات اضافه شده از RAG، LLMها می‌توانند پاسخ‌های دقیق‌تر و آگاه‌تر از زمینه را برای موارد استفاده خاص تولید کنند.

کیت توسعه نرم‌افزار AI Edge RAG برای اندروید در دسترس است و می‌تواند به‌طور کامل روی دستگاه اجرا شود. برای شروع استفاده از SDK، راهنمای اندروید را دنبال کنید که شما را با پیاده‌سازی اولیه یک برنامه نمونه با استفاده از RAG آشنا می‌کند.

خط لوله RAG

راه‌اندازی خط لوله RAG با AI Edge RAG SDK شامل مراحل کلیدی زیر است:

  1. وارد کردن داده‌ها : داده‌های متنی را که LLM هنگام تولید خروجی از آنها استفاده خواهد کرد، ارائه دهید.
  2. تقسیم و فهرست‌بندی داده‌ها : داده‌ها را برای فهرست‌بندی در پایگاه داده به قطعات کوچک تقسیم کنید.
  3. ایجاد جاسازی‌ها : از یک جاسازی‌کننده برای برداری‌سازی تکه‌ها جهت ذخیره در یک پایگاه داده برداری استفاده کنید.
  4. بازیابی اطلاعات : تعریف کنید که چگونه اطلاعات مرتبط برای رسیدگی به درخواست‌های کاربر شناسایی و بازیابی شوند. برای یک درخواست مشخص، مؤلفه بازیابی در پایگاه داده برداری جستجو می‌کند تا اطلاعات مرتبط را شناسایی کند.
  5. تولید متن با LLM : استفاده از یک مدل زبانی بزرگ برای تولید متن خروجی بر اساس اطلاعات بازیابی شده از پایگاه داده برداری.

ماژول‌های کلیدی

کیت توسعه نرم‌افزاری AI Edge RAG ماژول‌ها و APIهای کلیدی زیر را برای خط تولید RAG ارائه می‌دهد:

  • مدل‌های زبانی : مدل‌های LLM با APIهای open-prompt، چه محلی (روی دستگاه) و چه مبتنی بر سرور، کار می‌کنند. این API مبتنی بر رابط LanguageModel است.
  • مدل‌های جاسازی متن : تبدیل متن ساختاریافته و بدون ساختار به بردارهای جاسازی برای جستجوی معنایی. این API بر اساس رابط Embedder است.
  • فروشگاه‌های برداری : فروشگاه برداری، جاسازی‌ها و فراداده‌های مشتق شده از تکه‌های داده را در خود نگه می‌دارد. می‌توان برای دریافت تکه‌های مشابه یا تطابق‌های دقیق، از آن پرس‌وجو کرد. این API بر اساس رابط VectorStore است.
  • حافظه معنایی : به عنوان یک بازیابی‌گر معنایی برای بازیابی k قطعه داده مرتبط برتر با توجه به یک پرس‌وجو عمل می‌کند. این API بر اساس رابط SemanticMemory است.
  • تکه تکه کردن متن : داده‌های کاربر را به قطعات کوچکتر تقسیم می‌کند تا فهرست‌بندی را تسهیل کند. این API بر اساس رابط TextChunker است.

SDK زنجیره‌هایی را ارائه می‌دهد که چندین مؤلفه RAG را در یک خط لوله واحد ترکیب می‌کنند. می‌توانید از زنجیره‌ها برای هماهنگ کردن مدل‌های بازیابی و پرس‌وجو استفاده کنید. API مبتنی بر رابط Chain است. برای شروع، زنجیره بازیابی و استنتاج یا زنجیره بازیابی را امتحان کنید.