一、自发语音识别与理解的核心挑战 自发语音(Spontaneous Speech)区别于传统指令式语音,具有非结构化、口语化、多模态交互等特点。其核心挑战在于: 非标准化输入:用户可能包含停顿、重复、修正(如“把灯调亮……