راهنمای AI Edge RAG

AI Edge RAG SDK مؤلفه‌های اساسی را برای ایجاد خط لوله بازیابی نسل افزوده (RAG) با API استنتاج LLM فراهم می‌کند. خط لوله RAG دسترسی LLM ها را به داده های ارائه شده توسط کاربر فراهم می کند که می تواند شامل اطلاعات به روز، حساس یا دامنه خاص باشد. با قابلیت های اضافه شده بازیابی اطلاعات از RAG، LLM ها می توانند پاسخ های دقیق تر و آگاهانه تری را برای موارد استفاده خاص ایجاد کنند.

AI Edge RAG SDK برای اندروید در دسترس است و می‌توان آن را کاملاً روی دستگاه اجرا کرد. با دنبال کردن راهنمای Android، استفاده از SDK را شروع کنید، که شما را در اجرای اولیه یک برنامه نمونه با استفاده از RAG راهنمایی می‌کند.

خط لوله RAG

راه اندازی خط لوله RAG با AI Edge RAG SDK شامل مراحل کلیدی زیر است:

  1. داده‌های وارد کردن : داده‌های متنی را ارائه می‌کند که LLM هنگام تولید خروجی استفاده می‌کند.
  2. تقسیم و فهرست بندی داده ها : داده ها را به قطعات کوچک برای نمایه سازی در پایگاه داده تقسیم کنید.
  3. ایجاد جاسازی : از یک جاسازی برای بردار کردن تکه ها برای ذخیره در یک پایگاه داده برداری استفاده کنید.
  4. بازیابی اطلاعات : نحوه شناسایی و بازیابی اطلاعات مرتبط برای آدرس دادن به درخواست های کاربر را مشخص کنید. برای یک دستور داده شده، مؤلفه بازیابی در پایگاه داده برداری جستجو می کند تا اطلاعات مربوطه را شناسایی کند.
  5. تولید متن با LLM : از یک مدل زبان بزرگ برای تولید متن خروجی بر اساس اطلاعات بازیابی شده از پایگاه داده برداری استفاده کنید.

ماژول های کلیدی

AI Edge RAG SDK ماژول ها و API های کلیدی زیر را برای خط لوله RAG فراهم می کند:

  • مدل‌های زبان : مدل‌های LLM با API خط باز، محلی (روی دستگاه) یا مبتنی بر سرور، مدل‌سازی می‌کنند. API مبتنی بر رابط LanguageModel است.
  • مدل‌های جاسازی متن : متن ساختاریافته و بدون ساختار را برای جستجوی معنایی به بردارهای جاسازی شده تبدیل کنید. API مبتنی بر رابط Embedder است.
  • فروشگاه‌های برداری : ذخیره‌سازی بردار جاسازی‌ها و ابرداده‌های مشتق شده از تکه‌های داده را در خود نگه می‌دارد. برای بدست آوردن تکه های مشابه یا مطابقت دقیق می توان از آن پرس و جو کرد. API مبتنی بر رابط VectorStore است.
  • حافظه معنایی : به عنوان یک بازیابی معنایی برای بازیابی تکه های مربوط به بالا-k با یک پرس و جو استفاده می کند. API مبتنی بر رابط SemanticMemory است.
  • تکه تکه کردن متن : داده های کاربر را به قطعات کوچکتر تقسیم می کند تا نمایه سازی را تسهیل کند. API مبتنی بر رابط TextChunker است.

SDK زنجیره هایی را ارائه می دهد که چندین جزء RAG را در یک خط لوله واحد ترکیب می کند. می‌توانید از زنجیره‌ها برای تنظیم مدل‌های بازیابی و پرس و جو استفاده کنید. API بر اساس رابط زنجیره ای است. برای شروع، زنجیره بازیابی و استنتاج یا زنجیره بازیابی را امتحان کنید.