AI Edge RAG SDK مؤلفههای اساسی را برای ایجاد خط لوله بازیابی نسل افزوده (RAG) با API استنتاج LLM فراهم میکند. خط لوله RAG دسترسی LLM ها را به داده های ارائه شده توسط کاربر فراهم می کند که می تواند شامل اطلاعات به روز، حساس یا دامنه خاص باشد. با قابلیت های اضافه شده بازیابی اطلاعات از RAG، LLM ها می توانند پاسخ های دقیق تر و آگاهانه تری را برای موارد استفاده خاص ایجاد کنند.
AI Edge RAG SDK برای اندروید در دسترس است و میتوان آن را کاملاً روی دستگاه اجرا کرد. با دنبال کردن راهنمای Android، استفاده از SDK را شروع کنید، که شما را در اجرای اولیه یک برنامه نمونه با استفاده از RAG راهنمایی میکند.
خط لوله RAG
راه اندازی خط لوله RAG با AI Edge RAG SDK شامل مراحل کلیدی زیر است:
- دادههای وارد کردن : دادههای متنی را ارائه میکند که LLM هنگام تولید خروجی استفاده میکند.
- تقسیم و فهرست بندی داده ها : داده ها را به قطعات کوچک برای نمایه سازی در پایگاه داده تقسیم کنید.
- ایجاد جاسازی : از یک جاسازی برای بردار کردن تکه ها برای ذخیره در یک پایگاه داده برداری استفاده کنید.
- بازیابی اطلاعات : نحوه شناسایی و بازیابی اطلاعات مرتبط برای آدرس دادن به درخواست های کاربر را مشخص کنید. برای یک دستور داده شده، مؤلفه بازیابی در پایگاه داده برداری جستجو می کند تا اطلاعات مربوطه را شناسایی کند.
- تولید متن با LLM : از یک مدل زبان بزرگ برای تولید متن خروجی بر اساس اطلاعات بازیابی شده از پایگاه داده برداری استفاده کنید.
ماژول های کلیدی
AI Edge RAG SDK ماژول ها و API های کلیدی زیر را برای خط لوله RAG فراهم می کند:
- مدلهای زبان : مدلهای LLM با API خط باز، محلی (روی دستگاه) یا مبتنی بر سرور، مدلسازی میکنند. API مبتنی بر رابط LanguageModel است.
- مدلهای جاسازی متن : متن ساختاریافته و بدون ساختار را برای جستجوی معنایی به بردارهای جاسازی شده تبدیل کنید. API مبتنی بر رابط Embedder است.
- فروشگاههای برداری : ذخیرهسازی بردار جاسازیها و ابردادههای مشتق شده از تکههای داده را در خود نگه میدارد. برای بدست آوردن تکه های مشابه یا مطابقت دقیق می توان از آن پرس و جو کرد. API مبتنی بر رابط VectorStore است.
- حافظه معنایی : به عنوان یک بازیابی معنایی برای بازیابی تکه های مربوط به بالا-k با یک پرس و جو استفاده می کند. API مبتنی بر رابط SemanticMemory است.
- تکه تکه کردن متن : داده های کاربر را به قطعات کوچکتر تقسیم می کند تا نمایه سازی را تسهیل کند. API مبتنی بر رابط TextChunker است.
SDK زنجیره هایی را ارائه می دهد که چندین جزء RAG را در یک خط لوله واحد ترکیب می کند. میتوانید از زنجیرهها برای تنظیم مدلهای بازیابی و پرس و جو استفاده کنید. API بر اساس رابط زنجیره ای است. برای شروع، زنجیره بازیابی و استنتاج یا زنجیره بازیابی را امتحان کنید.