一、技术演进:从Scale-out到Scale-up的范式革命 大模型训练的算力需求呈现指数级增长,万亿参数模型与混合专家架构(MoE)的普及,使得传统分布式训练面临三大核心瓶颈:通信效率、内存墙和功耗控制。在MoE架构中……