一、技术背景与需求分析 PDF作为跨平台文档格式,广泛应用于合同、报告、学术文献等场景。然而,PDF中的文本信息常以图像形式嵌入(如扫描件或生成时未保留文本层),导致直接提取困难。传统OCR技术需依赖本地化工……