一、模型蒸馏技术背景与DeepSeek R1的核心价值 1.1 模型蒸馏的必要性 在AI Agent开发中,大型语言模型(LLM)的推理成本与硬件需求常成为瓶颈。以GPT-3.5为例,其单次推理需消耗约10GB显存,而边缘设备或低成本云……