一、数据准备:构建高质量训练集的三大原则 1.1 数据采集与清洗 数据质量直接影响模型性能,需遵循”三性原则”: 代表性:覆盖目标场景的所有可能输入分布。例如文本生成任务需包含不同领域(新闻、小说、技术文档……