一、技术背景:轻量化大模型的行业需求与挑战 随着AI技术向边缘设备、移动终端的渗透,传统大模型因参数量庞大(通常数十亿至千亿级)导致的计算资源消耗高、推理延迟长等问题日益凸显。行业迫切需要一种兼顾性能……