一、技术演进与核心架构 智能语音合成技术历经波形拼接、参数合成到端到端深度学习三个阶段,当前主流方案采用基于Transformer的神经网络架构。某头部云厂商推出的语音生成基座模型采用分层编码器-解码器结构,其……