一、技术背景与行业痛点 传统文本转语音(TTS)系统长期面临两大核心挑战:语义对齐偏差与计算资源消耗。在语义对齐方面,基于注意力机制的模型常因局部注意力权重异常导致”token级幻觉”,例如将”重庆”误读为”重新……