一、技术背景与核心问题 在AI模型部署中,开发者常面临两难选择:大模型(如BERT、ResNet)性能优异但计算资源消耗高,难以在边缘设备或低算力环境中运行;小模型(如MobileNet、TinyBERT)资源占用低,但准确率、……