一、技术背景与行业痛点 传统语音交互系统通常采用模块化架构,将语音识别(ASR)、自然语言处理(NLP)与语音合成(TTS)拆分为独立模块,依赖中间数据格式(如文本)进行串联。这种架构存在三大核心痛点: 信息……