强化学习中的模型蒸馏:原理、方法与实践 在强化学习(RL)领域,随着深度神经网络(DNN)的广泛应用,模型规模与计算资源需求之间的矛盾日益突出。尤其是在边缘设备部署或实时决策场景中,大型强化学习模型的高延……