一、技术演进:从单模态到多模态的认知跃迁 传统文本处理技术长期受限于单模态输入,仅能解析纯文本的语法结构与表层语义。例如,基于BERT的预训练模型虽能捕捉上下文依赖关系,却无法理解文本在物理空间中的布局……