一、深度神经网络训练的困境与突破 随着神经网络层数突破50层甚至100层,传统结构面临梯度消失/爆炸的致命问题。某主流云服务商的基准测试显示,当网络深度超过20层时,ResNet50的训练误差较浅层网络反而上升12%,……