一、技术融合的背景与必要性 传统语音识别技术(ASR)基于声学模型与语言模型的联合优化,通过隐马尔可夫模型(HMM)或深度神经网络(DNN)实现语音到文本的转换。然而,其局限性逐渐显现:上下文理解能力弱(如无……