一、模型轻量化的核心挑战与现有方案 在AI模型部署中,资源受限场景(如移动端、边缘设备)对模型推理速度、内存占用和功耗提出严苛要求。传统方法主要通过模型剪枝(移除冗余参数)和模型蒸馏(用大模型指导小模……