EMA模型蒸馏:高效压缩与性能优化的技术实践 引言:模型轻量化的迫切需求 在深度学习技术快速发展的背景下,模型参数规模与计算资源消耗的矛盾日益突出。以BERT为代表的预训练语言模型,参数规模可达数亿级别,直……