一、技术背景与核心价值 在深度学习模型部署场景中,模型大小与推理效率的矛盾日益突出。以ResNet-50为例,原始FP32模型参数量达25.6M,在移动端设备上单次推理延迟超过100ms。知识蒸馏(Knowledge Distillation)……