知识蒸馏:如何用一个神经网络训练另一个神经网络 一、知识蒸馏的技术本质:从黑箱到可解释的迁移 传统神经网络训练依赖标注数据的硬标签(one-hot编码),而知识蒸馏通过引入教师网络(Teacher Model)的软输出(……