一、NLP模型轻量化的技术背景与挑战 在自然语言处理(NLP)领域,模型规模与性能之间的矛盾日益突出。以BERT、GPT为代表的大型预训练模型,参数量可达数亿甚至千亿级别,导致推理延迟高、硬件要求苛刻、部署成本居……