关于知识蒸馏的三类核心算法解析 知识蒸馏(Knowledge Distillation)作为模型压缩与加速的核心技术,通过将大型教师模型(Teacher Model)的”知识”迁移到轻量级学生模型(Student Model),在保持性能的同时显著……