llm-rag-eval

Vlerësues i fuqishëm i modelit të gjuhës së madhe për tubacionet RAG.

Çfarë bën

Ai siguron një kornizë të bazuar në LLM për të vlerësuar performancën e sistemeve RAG duke përdorur një grup metrikash që janë optimizuar për domenin e aplikacionit ku operon (sistemi RAG). Ne kemi përdorur Gemini Pro 1.0 nga Google AI si LLM që përdor korniza. Ne kemi përdorur gjithashtu modelin e futjes së AI të Google për të gjeneruar ngulitje për disa nga metrikat.

E ndertuar me

  • Asnjë

Ekipi

Nga

llm-rag-eval

Nga

Shtetet e Bashkuara