一、技术演进背景:从ASR到TTS的架构迁移 传统语音合成领域长期面临两大技术矛盾:一方面,基于Transformer的模型通过自注意力机制实现了上下文建模突破,但参数量普遍超过500M,难以部署在边缘设备;另一方面,对……
一、技术背景:传统语音合成的痛点与行业需求 在语音交互场景中,零样本语音合成(Zero-Shot Text-to-Speech, TTS)与对话语音合成是两大核心需求。然而,传统方案普遍面临两大瓶颈: 参数量与推理效率的矛盾:主……