Oceniacz oparty na dużym modelu językowym do potoków RAG.
Działanie
Zapewnia ono platformę opartą na LLM do oceny skuteczności systemów RAG za pomocą zestawu danych, które są optymalizowane pod kątem domeny aplikacji, w której działa system RAG. Jako frameworka LLM użyto Gemini Pro 1.0 od Google AI. Użyliśmy też modelu sztucznej inteligencji Google do wygenerowania wektorów wstępujących dla niektórych danych.
Utworzone za pomocą
Brak
Zespół
Autor:
llm-rag-eval
Od
Stany Zjednoczone
[[["Łatwo zrozumieć","easyToUnderstand","thumb-up"],["Rozwiązało to mój problem","solvedMyProblem","thumb-up"],["Inne","otherUp","thumb-up"]],[["Brak potrzebnych mi informacji","missingTheInformationINeed","thumb-down"],["Zbyt skomplikowane / zbyt wiele czynności do wykonania","tooComplicatedTooManySteps","thumb-down"],["Nieaktualne treści","outOfDate","thumb-down"],["Problem z tłumaczeniem","translationIssue","thumb-down"],["Problem z przykładami/kodem","samplesCodeIssue","thumb-down"],["Inne","otherDown","thumb-down"]],[],[],[]]