一、参数效率革命:小模型的”瘦身术” 1.1 参数压缩技术 小模型的核心竞争力在于参数效率的极致优化。知识蒸馏技术通过”教师-学生”架构,将大模型的泛化能力迁移至小模型。例如,DistilBERT通过软目标损失函数,在……