一、技术背景与部署价值 DeepSeek-R1作为基于Transformer架构的轻量化语言模型,通过知识蒸馏技术将原始大模型的核心能力压缩至更小参数量级(通常为原始模型的10%-30%)。这种蒸馏版模型在保持较高推理准确率的同……