一、深度学习蒸馏技术基础与核心原理 1.1 知识蒸馏的本质:从教师模型到学生模型的迁移 知识蒸馏(Knowledge Distillation)通过将大型教师模型的“软目标”(soft targets)作为监督信号,引导学生模型学习其泛化能……