一、知识蒸馏技术背景与核心价值 在自然语言处理(NLP)领域,预训练语言模型(PLM)的参数量持续攀升,如BERT-base的1.1亿参数、GPT-3的1750亿参数,导致模型部署对算力与存储提出极高要求。知识蒸馏(Knowledge ……