一、多模态认知技术的演进背景与挑战 传统人工智能系统通常聚焦单一模态(如文本或图像)的处理,但在真实场景中,用户需求往往涉及多模态信息的融合。例如,医疗诊断需结合病历文本、影像数据与语音问诊记录,工……