一、基础结构:分层存储与元数据管理 SFT(Supervised Fine-Tuning)数据集的核心结构需满足分层存储与元数据标准化两大要求。分层存储通过将原始数据、标注数据、预处理结果分离存储,可提升数据访问效率。例如,……