一、知识蒸馏:AI模型优化的”炼金术” 知识蒸馏(KD)的本质是通过”教师-学生”模型架构实现知识迁移。教师模型(高精度大模型)将复杂的知识以软目标(soft targets)形式传递给学生模型(轻量化小模型),使学生模……