一、研究背景与实验动机 近年来,大语言模型(LLM)的参数规模呈指数级增长,GPT-3等模型参数突破千亿级别,导致其部署成本高昂。在边缘计算场景中,资源受限的设备(如手机、IoT终端)难以直接运行此类模型。模型……