一、大模型技术演进的核心路径 1.1 架构创新:从Transformer到混合专家模型 2017年Transformer架构的提出彻底改变了自然语言处理领域,其自注意力机制解决了传统RNN的序列依赖问题。以GPT-3为例,1750亿参数的规模……