一、生成质量评估的核心挑战 在自然语言生成(NLG)任务中,如何量化模型输出与人类预期的契合度始终是核心问题。传统人工评估存在效率低、主观性强等缺陷,而自动化评估指标通过数学建模实现了高效量化,但不同指……