对话状态跟踪评估指标:如何衡量AI原生应用的对话质量 引言:对话质量为何需要“状态跟踪”? 在AI原生应用(如智能客服、语音助手、教育机器人)中,对话质量直接影响用户体验与业务转化率。传统评估指标(如BLEU、……