一、技术背景:蒸馏模型的局限与突破需求 传统蒸馏模型通过压缩大模型参数实现高效部署,但其核心缺陷在于固定长度的中间推理步骤。以DeepSeek为代表的蒸馏模型在数学证明、代码生成等复杂任务中,常因推理链长度……