一、梯度问题的本质与影响 深度神经网络的训练过程本质上是通过反向传播算法调整各层参数,使得损失函数逐步收敛的过程。然而当网络层数超过一定深度时,梯度在反向传播过程中会出现指数级衰减或激增的现象,这种……