引言 在人工智能快速发展的今天,OCR(Optical Character Recognition,光学字符识别)技术已从传统的单模态识别迈向多模态融合的新阶段。其中,OCR VLM(Visual Language Model,视觉语言模型)作为多模态大模型O……