一、蒸馏损失函数的理论基础 1.1 知识蒸馏的核心思想 知识蒸馏(Knowledge Distillation)通过将大型教师模型(Teacher Model)的”软目标”(Soft Targets)迁移到小型学生模型(Student Model),实现模型压缩与性……