一、大模型演进驱动超节点架构成为刚需 大模型参数规模突破万亿级已成为行业常态,混合专家模型(MoE)架构的广泛应用进一步加剧了算力需求的结构性变化。在MoE架构中,专家并行(EP)机制要求每个训练批次的数据……