EMA模型蒸馏:高效压缩与性能提升的深度实践 引言 在深度学习模型部署中,大模型的高计算成本与存储需求常成为瓶颈。模型蒸馏(Model Distillation)通过知识迁移,将大型教师模型的能力压缩到轻量级学生模型中,……