一、大模型演进催生Scale-up超节点技术刚需 大模型参数规模突破万亿级已成为行业共识,混合专家架构(MoE)的广泛应用进一步加剧了算力需求与通信效率的矛盾。以某主流MoE模型为例,其包含128个专家模块,训练过程……