一、大语言模型训练的核心挑战:动态失衡与效率瓶颈 在大语言模型(LLM)的训练过程中,模型参数规模与数据复杂度的指数级增长带来了两大核心难题:梯度失衡与过拟合风险。当模型层数超过百层时,反向传播过程中的……