一、多模态大模型的“感知困境”:从“看到”到“理解”的断层 多模态大模型的核心目标是实现跨模态(如文本、图像、视频)的语义对齐与联合推理。然而,当前主流技术方案中,模型常表现出一种“伪多模态”现象:当输入包……