DeepSeek参数微调显存优化:冻结策略的深度技术解析 一、显存需求的核心矛盾与冻结策略的必要性 在大型语言模型(LLM)微调场景中,显存需求与模型规模呈非线性增长关系。以DeepSeek系列模型为例,当参数量突破百……