一、知识蒸馏的技术本质与核心价值 知识蒸馏(Knowledge Distillation)通过构建”教师-学生”模型架构,将大型复杂模型(教师模型)的泛化能力迁移至轻量级模型(学生模型)。其核心在于利用教师模型输出的软目标(……