کیت توسعه نرمافزاری AI Edge RAG اجزای اساسی برای ساخت یک خط تولید افزوده بازیابی (RAG) با رابط برنامهنویسی کاربردی استنتاج LLM را فراهم میکند. یک خط تولید RAG به LLMها امکان دسترسی به دادههای ارائه شده توسط کاربر را میدهد که میتواند شامل اطلاعات بهروز، حساس یا خاص دامنه باشد. با قابلیتهای بازیابی اطلاعات اضافه شده از RAG، LLMها میتوانند پاسخهای دقیقتر و آگاهتر از زمینه را برای موارد استفاده خاص تولید کنند.
کیت توسعه نرمافزار AI Edge RAG برای اندروید در دسترس است و میتواند بهطور کامل روی دستگاه اجرا شود. برای شروع استفاده از SDK، راهنمای اندروید را دنبال کنید که شما را با پیادهسازی اولیه یک برنامه نمونه با استفاده از RAG آشنا میکند.
خط لوله RAG
راهاندازی خط لوله RAG با AI Edge RAG SDK شامل مراحل کلیدی زیر است:
- وارد کردن دادهها : دادههای متنی را که LLM هنگام تولید خروجی از آنها استفاده خواهد کرد، ارائه دهید.
- تقسیم و فهرستبندی دادهها : دادهها را برای فهرستبندی در پایگاه داده به قطعات کوچک تقسیم کنید.
- ایجاد جاسازیها : از یک جاسازیکننده برای برداریسازی تکهها جهت ذخیره در یک پایگاه داده برداری استفاده کنید.
- بازیابی اطلاعات : تعریف کنید که چگونه اطلاعات مرتبط برای رسیدگی به درخواستهای کاربر شناسایی و بازیابی شوند. برای یک درخواست مشخص، مؤلفه بازیابی در پایگاه داده برداری جستجو میکند تا اطلاعات مرتبط را شناسایی کند.
- تولید متن با LLM : استفاده از یک مدل زبانی بزرگ برای تولید متن خروجی بر اساس اطلاعات بازیابی شده از پایگاه داده برداری.
ماژولهای کلیدی
کیت توسعه نرمافزاری AI Edge RAG ماژولها و APIهای کلیدی زیر را برای خط تولید RAG ارائه میدهد:
- مدلهای زبانی : مدلهای LLM با APIهای open-prompt، چه محلی (روی دستگاه) و چه مبتنی بر سرور، کار میکنند. این API مبتنی بر رابط LanguageModel است.
- مدلهای جاسازی متن : تبدیل متن ساختاریافته و بدون ساختار به بردارهای جاسازی برای جستجوی معنایی. این API بر اساس رابط Embedder است.
- فروشگاههای برداری : فروشگاه برداری، جاسازیها و فرادادههای مشتق شده از تکههای داده را در خود نگه میدارد. میتوان برای دریافت تکههای مشابه یا تطابقهای دقیق، از آن پرسوجو کرد. این API بر اساس رابط VectorStore است.
- حافظه معنایی : به عنوان یک بازیابیگر معنایی برای بازیابی k قطعه داده مرتبط برتر با توجه به یک پرسوجو عمل میکند. این API بر اساس رابط SemanticMemory است.
- تکه تکه کردن متن : دادههای کاربر را به قطعات کوچکتر تقسیم میکند تا فهرستبندی را تسهیل کند. این API بر اساس رابط TextChunker است.
SDK زنجیرههایی را ارائه میدهد که چندین مؤلفه RAG را در یک خط لوله واحد ترکیب میکنند. میتوانید از زنجیرهها برای هماهنگ کردن مدلهای بازیابی و پرسوجو استفاده کنید. API مبتنی بر رابط Chain است. برای شروع، زنجیره بازیابی و استنتاج یا زنجیره بازیابی را امتحان کنید.