一、技术背景:AI算力需求驱动芯片架构革新 随着大模型参数量从千亿级向万亿级跨越,传统GPU集群在卡间通信延迟、显存容量限制、能效比瓶颈等方面逐渐暴露短板。以某主流云厂商的A100集群为例,在训练千亿参数模型……