一、蒸馏强化学习的核心定义与技术背景 蒸馏强化学习(Distilled Reinforcement Learning, DRL)是强化学习与知识蒸馏技术的交叉领域,其核心目标是通过教师-学生模型架构,将复杂、高计算成本的强化学习策略(教……