一、知识蒸馏技术:模型能力迁移的核心框架 知识蒸馏(Knowledge Distillation)作为一种高效的模型压缩与能力迁移技术,通过构建”教师-学生”模型架构,将大型模型(教师)的隐式知识(如中间层特征、注意力分布)……