一、技术选型前的核心认知:预处理比模型更重要 在构建基于PDF的本地知识库时,开发者常陷入”模型崇拜”误区——直接使用更强大的嵌入模型(Embedding Model)处理原始PDF,却忽视文档本身的异构性。实际场景中,PDF……