引言:端侧AI计算的范式变革 随着生成式AI技术的爆发式增长,云端大模型的高算力需求与端侧设备的有限资源之间的矛盾日益凸显。如何在保持低功耗的前提下,将云端大模型的推理能力下沉至端侧设备,成为行业亟待解……