一、评估体系构建的核心逻辑 企业级大模型知识库问答系统的评估需突破传统NLP任务的单一维度,建立覆盖技术性能与业务价值的复合型指标体系。评估框架需兼顾模型能力、知识库质量、系统架构三者的协同效应,避免因……