一、DeepSeek模型背景与核心定位 DeepSeek作为一款基于R1蒸馏策略优化的轻量化语言模型,其核心设计目标是在保持Qwen1.5B(15亿参数)基础能力的前提下,通过知识蒸馏技术实现模型体积与推理效率的双重突破。这一……