一、知识蒸馏技术原理与演进路径 知识蒸馏(Knowledge Distillation, KD)作为模型压缩领域的核心技术,其核心思想是通过构建教师-学生模型架构,将大型复杂模型(教师)的软目标(soft targets)知识迁移到轻量级……