一、新一代AI计算架构的演进背景 随着大模型参数规模突破千亿级,传统GPU集群面临两大核心挑战:其一,卡间通信带宽成为训练效率的瓶颈,尤其在混合精度训练场景下,参数同步延迟占比超过30%;其二,分布式训练框……