一、大模型架构优化:从参数堆砌到效率革命 动态稀疏激活技术突破某研究团队提出基于动态门控网络的稀疏激活架构,通过训练阶段引入可学习的门控单元,实现模型推理时仅激活15%-20%的神经元。实验数据显示,在保……