一、技术定位与核心挑战传统文本转语音(TTS)系统在对话场景中普遍存在两大痛点:情感表达生硬与韵律处理粗糙。当需要生成包含笑声、停顿等副语言特征的对话语音时,常规模型往往难以捕捉上下文关联性,导致输出……