一、知识蒸馏技术:大模型轻量化的核心路径 知识蒸馏(Knowledge Distillation)通过将大型教师模型(Teacher Model)的”知识”迁移到小型学生模型(Student Model),实现模型压缩与性能保留的平衡。DeepSeek-R1作……