一、技术演进背景与核心挑战 在语音合成技术发展历程中,自回归(AR)模型凭借其强大的上下文建模能力,长期占据主流地位。然而,这类模型存在两大固有缺陷:其一,生成过程依赖前序输出,导致语音时长难以精确控……