一、熵类损失函数在大模型中的核心地位 在大规模语言模型(LLM)的训练中,损失函数是指导模型参数更新的核心指标。传统均方误差(MSE)在分类任务中存在梯度消失问题,而基于信息论的熵类损失函数因其数学特性成……