一、技术背景:大模型时代的算力挑战 随着生成式AI技术的爆发,MoE(Mixture of Experts)架构因其动态路由机制成为千亿、万亿参数模型的主流选择。然而,传统单卡显存限制导致模型部署面临两大矛盾: 模型规模与……