一、少数民族文字OCR的技术实现路径 1.1 数据层构建:多模态数据采集与标注体系 少数民族文字OCR的核心瓶颈在于数据稀缺性。以彝文为例,其字符集包含800余个基础字符,且存在大量异体字,传统数据采集需覆盖古籍……