一、声学模型架构:非自回归与流式生成的双重突破 传统语音合成系统多采用自回归(AR)模型,如Tacotron系列,其逐帧生成方式虽能保证音质,但存在两大缺陷:一是推理速度受限于序列长度,二是难以实现实时流式输……