llm-rag-eval
ارزیاب قدرتمند مدل زبان بزرگ برای خطوط لوله RAG.
کاری که انجام می دهد
این یک چارچوب مبتنی بر LLM برای ارزیابی عملکرد سیستمهای RAG با استفاده از مجموعهای از معیارها ارائه میکند که برای دامنه برنامهای که در آن (سیستم RAG) در آن کار میکند بهینهسازی شدهاند. ما از Gemini Pro 1.0 از Google AI به عنوان LLM استفاده کردهایم. ما همچنین از مدل تعبیه هوش مصنوعی گوگل برای ایجاد جاسازی برای برخی از معیارها استفاده کردهایم.
ساخته شده با
- هیچ کدام
تیم
توسط
llm-rag-eval
از
ایالات متحده