一、多模态OCR的技术背景与挑战 1.1 传统OCR的局限性 传统OCR技术主要依赖单模态(视觉)输入,通过图像预处理、字符分割、特征提取等步骤实现文本识别。但在票据识别场景中,存在三大核心问题: 复杂版式适应差……