一、ChatGPT问答效能评估体系构建 1.1 核心评估指标设计 基于NLP任务特性,构建包含准确性、时效性、连贯性、多样性四大维度的评估框架。准确性指标通过语义相似度计算(BERTScore)、事实一致性检测(FactCheck)……