一、技术背景:大模型推理成本困局与MoE架构的突破 在AI大模型从实验室走向产业应用的过程中,推理成本成为制约规模化落地的核心瓶颈。以3000亿参数的稠密模型为例,其单次推理需激活全部参数,计算量与显存占用呈……