一、数学基础:大模型的核心语言 大模型的训练与推理依赖于概率论、线性代数和优化理论的深度融合,以下三个方向是理解模型行为的关键: 1.1 概率论与信息论 核心概念:条件概率、贝叶斯定理、熵与交叉熵、KL散度……