一、大模型进化催生计算架构范式转移 当前主流大模型参数规模已普遍突破万亿量级,混合专家架构(MoE)通过动态路由机制显著提升模型容量,但随之而来的高频All-to-All通信需求对计算节点间互联带宽提出严苛要求。……