一、大模型架构创新:从Transformer到混合专家系统 大模型的发展始终围绕”如何提升性能与效率”这一核心命题展开。当前主流架构已从早期Transformer的单一范式,演进为混合专家系统(MoE)、稀疏激活模型等创新结构……