一、技术突破:变长思维链的动态调节机制 1.1 思维链长度的自适应扩展传统蒸馏模型(如DeepSeek)采用固定长度的思维链(Chain-of-Thought, CoT),在复杂推理任务中易因步骤缺失导致错误。DistilQwen-ThoughtX引……