一、技术架构与核心创新 1.1 Transformer变体与多尺度韵律建模 ChatTTS采用基于Transformer的深度神经网络架构,通过自注意力机制捕捉文本与语音间的长程依赖关系。其核心创新在于多尺度韵律建模模块,该模块通过……