一、训练前的核心准备:数据与工具链搭建 1.1 数据收集与清洗策略 训练聊天机器人的核心基础是高质量对话数据,需从三个维度构建数据集: 垂直领域数据:针对医疗、教育等场景,需收集专业术语库与场景化对话(如……