DeepSeek R1蒸馏法:大模型”瘦身”革命与智能守恒 一、技术演进背景:大模型时代的”效率悖论” 自GPT-3开启千亿参数时代以来,大模型展现出惊人的语言理解和生成能力,但随之而来的”效率悖论”日益凸显:某主流1750亿……