一、大模型训练范式变革驱动算力架构重构 大模型参数规模突破万亿级已成为行业共识,混合专家模型(MoE)架构的广泛应用进一步加剧了算力需求的结构性变化。以某开源MoE模型为例,其包含16个专家模块,训练过程中……