一、混合精度训练:显存与速度的双重优化 1.1 精度权衡的数学基础 深度学习模型训练中,数值计算精度直接影响显存占用与计算效率。FP32(32位浮点数)提供约7位有效数字,可精确表示±3.4×10³⁸范围内的数值;而FP16……