Avaliador com tecnologia de modelo de linguagem grande para pipelines de RAG.
O que faz?
Ele fornece um framework baseado em LLM para avaliar o desempenho dos sistemas de RAG usando um conjunto de métricas otimizadas para o domínio do aplicativo em que o sistema de RAG opera. Usamos o Gemini Pro 1.0 da IA do Google como o LLM usado pela estrutura. Também usamos o modelo de embedding de IA do Google para gerar embeddings para algumas das métricas.
Desenvolvido com
Nenhum
Equipe
Por
llm-rag-eval
De
Estados Unidos
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Não contém as informações de que eu preciso","missingTheInformationINeed","thumb-down"],["Muito complicado / etapas demais","tooComplicatedTooManySteps","thumb-down"],["Desatualizado","outOfDate","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Problema com as amostras / o código","samplesCodeIssue","thumb-down"],["Outro","otherDown","thumb-down"]],[],[],[]]