一、技术背景:语音合成领域的”小参数”革命 传统语音合成模型(如Tacotron、FastSpeech)通常依赖数十亿参数的深度神经网络,通过自回归或非自回归架构生成语音特征。这类模型虽能实现较高自然度,但存在两大痛点……