一、DeepSeek-R1:技术突破与性能飞跃 1.1 推理性能直逼o1:技术架构解析 DeepSeek-R1的核心创新在于其混合专家架构(MoE)与动态注意力机制的深度融合。通过将模型参数拆分为多个专家子模块(每个子模块约10B参数……