llm-rag-eval
Vlerësues i fuqishëm i modelit të gjuhës së madhe për tubacionet RAG.
Çfarë bën
Ai siguron një kornizë të bazuar në LLM për të vlerësuar performancën e sistemeve RAG duke përdorur një grup metrikash që janë optimizuar për domenin e aplikacionit ku operon (sistemi RAG). Ne kemi përdorur Gemini Pro 1.0 nga Google AI si LLM që përdor korniza. Ne kemi përdorur gjithashtu modelin e futjes së AI të Google për të gjeneruar ngulitje për disa nga metrikat.
E ndertuar me
- Asnjë
Ekipi
Nga
llm-rag-eval
Nga
Shtetet e Bashkuara