llm-rag-eval
Evaluador potenciado por modelos de lenguaje extensos para canalizaciones de RAG.
Qué hace
Proporciona un marco de trabajo basado en LLM para evaluar el rendimiento de los sistemas de RAG con un conjunto de métricas optimizadas para el dominio de aplicación en el que opera (el sistema de RAG). Usamos Gemini Pro 1.0 de Google AI como el LLM que usa el framework. También usamos el modelo de incorporación de la IA de Google para generar incorporaciones para algunas de las métricas.
Con la tecnología de
- Ninguno
Equipo
De
llm-rag-eval
De
Estados Unidos