在基于大模型(LLM)的检索增强生成(RAG)系统中,评估体系需覆盖从文档检索到答案生成的全链路。一个完整的RAG系统通常包含检索、重排序、生成三大核心模块,其性能直接受检索准确性、重排序有效性及生成内容质……