llm-rag-eval

Evaluador potenciado por modelos de lenguaje extensos para canalizaciones de RAG.

Qué hace

Proporciona un marco de trabajo basado en LLM para evaluar el rendimiento de los sistemas de RAG con un conjunto de métricas optimizadas para el dominio de aplicación en el que opera (el sistema de RAG). Usamos Gemini Pro 1.0 de Google AI como el LLM que usa el framework. También usamos el modelo de incorporación de la IA de Google para generar incorporaciones para algunas de las métricas.

Con la tecnología de

  • Ninguno

Equipo

De

llm-rag-eval

De

Estados Unidos