一、多模态大模型在文档处理中的技术定位 文档处理是自然语言处理(NLP)与计算机视觉(CV)的交叉领域,传统方案依赖单一模态的模型分工(如OCR识别文本、NLP提取语义),但存在信息割裂、上下文理解不足等问题。……