一、多模态文档理解的现状与挑战 在数字化转型浪潮中,文档智能化处理已成为企业降本增效的核心需求。当前主流多模态大模型(如某开源7B参数模型、某视觉指令优化模型)虽在图像描述、视频理解等任务上表现优异,……