DeepSeek冻结参数微调显存优化指南 - 云主机网

最新文章

DeepSeek冻结参数微调显存优化指南

DeepSeek冻结部分参数微调的显存需求深度解析一、技术背景与核心问题在深度学习模型微调场景中，全参数微调往往面临显存瓶颈。以DeepSeek-R1-67B模型为例，若采用全参数微调，在FP16精度下需要约134GB显存（67B……

2025年10月24日互联网