1500万数据重塑AI价值观:WorldPM-72B-RLHFLow揭示偏好建模规模化定律 一、数据规模临界点:1500万样本的质变效应 在AI模型训练中,数据规模与模型性能的关系长期遵循”越多越好”的朴素认知,但WorldPM-72B-RLHFLow……