什么是模型蒸馏? 模型蒸馏(Model Distillation)是一种将大型复杂模型(教师模型)的知识迁移到小型轻量模型(学生模型)的技术。其核心思想是通过软目标(soft target)传递教师模型的概率分布信息,而非仅依赖……