一、非结构化文档:RAG系统的”隐形枷锁” 在金融、医疗、科研等领域,超过80%的知识载体以非结构化形式存在:PDF报告中的复杂表格、扫描文件中的手写批注、技术文档中的跨页图表,这些信息在传统OCR处理中面临三大……