一、技术突破:非自回归架构重构语音生成范式 传统语音合成(TTS)模型普遍采用自回归架构,即逐帧生成音频信号,这种模式虽能保证音质,但存在两个致命缺陷:一是推理延迟随序列长度线性增加,二是显存占用与计算……