一、模型蒸馏的技术背景与核心价值 随着人工智能大模型参数规模突破千亿级,训练与推理成本呈指数级增长。以自然语言处理领域为例,主流大模型单次训练需消耗数万GPU小时,推理延迟达数百毫秒,难以满足边缘设备与……