DeepSeek模型训练全解析:从架构设计到工程优化