一、多模态文档解析的架构设计:MinerU2.5核心框架 多模态文档解析的核心在于构建文本、图像、版面三要素的联合表征空间。MinerU2.5架构采用模块化分层设计,通过三大核心模块实现跨模态信息融合: 视觉-文本联合……