一、数据规模与模型能力的非线性关系 训练数据量突破100万亿Token后,模型能力提升呈现显著的非线性特征。在数据量达到10万亿Token时,模型在通用任务上的准确率提升约15%;当数据量突破50万亿Token后,同一指标的……