一、技术背景与核心价值 DeepSeek-R1作为基于Transformer架构的轻量化语言模型,通过知识蒸馏技术将参数规模压缩至1.5B-7B区间,在保持核心推理能力的同时,将推理延迟降低至传统模型的1/3。这种特性使其特别适合……