随着AI模型参数量从千亿级向万亿级跨越,传统单卡计算架构已难以满足算力需求,分布式训练与超节点互联成为必然选择。然而,现有互联方案在带宽、延迟与扩展性上面临严峻挑战:7nm以下先进制程下,单芯片面积受”光……