llm-rag-eval

ارزیاب قدرتمند مدل زبان بزرگ برای خطوط لوله RAG.

کاری که انجام می دهد

این یک چارچوب مبتنی بر LLM برای ارزیابی عملکرد سیستم‌های RAG با استفاده از مجموعه‌ای از معیارها ارائه می‌کند که برای دامنه برنامه‌ای که در آن (سیستم RAG) در آن کار می‌کند بهینه‌سازی شده‌اند. ما از Gemini Pro 1.0 از Google AI به عنوان LLM استفاده کرده‌ایم. ما همچنین از مدل تعبیه هوش مصنوعی گوگل برای ایجاد جاسازی برای برخی از معیارها استفاده کرده‌ایم.

ساخته شده با

  • هیچ کدام

تیم

توسط

llm-rag-eval

از

ایالات متحده