一、知识蒸馏技术原理与NLP适配性 知识蒸馏通过构建教师-学生模型框架,将大型预训练模型(教师)的软标签(soft target)和隐式知识迁移至轻量化模型(学生),在保持性能的同时显著降低计算资源消耗。在NLP领域……