一、技术背景:从模块化到端到端的范式转变 传统语音对话系统通常采用“语音识别(ASR)+自然语言处理(NLP)+语音合成(TTS)”的模块化架构,各环节独立优化,存在误差累积、上下文断裂等问题。例如,ASR模块的识……