一、文档理解的技术演进与LayOutLM的定位 文档理解作为自然语言处理(NLP)的核心分支,经历了从规则匹配到深度学习的范式转变。传统OCR(光学字符识别)技术仅能提取文本内容,无法捕捉文档的视觉结构(如表格、……