一、模型压缩技术:在精度与效率间寻找平衡点模型压缩是降低计算资源消耗的基础手段,其核心目标是在可接受的精度损失范围内,尽可能减少模型参数量与计算复杂度。当前主流技术可分为三类: 1.1 量化技术:从浮点……