一、大模型技术的核心演进路径 1.1 架构创新:从Transformer到混合专家模型 2017年Transformer架构的提出彻底改变了自然语言处理范式,其自注意力机制使模型能够捕捉长距离依赖关系。Google在2020年推出的Switch T……