一、DeepSeek 引发的技术蝴蝶效应:为何蒸馏成为焦点? 2023年末,DeepSeek 团队通过模型蒸馏技术将 1750 亿参数的 GPT-3.5 压缩至 13 亿参数,在保持 92% 任务准确率的同时,推理速度提升 15 倍。这一突破性成果……