1. 引言:知识蒸馏的技术背景与DeepSeek的突破 在人工智能模型规模指数级增长的背景下,大模型部署面临计算资源、能耗与响应延迟的三重挑战。以GPT-3为例,其1750亿参数规模需要数百GB显存支持,直接限制了在边缘……