一、架构创新:从Transformer到混合专家系统的范式跃迁 大模型的核心演进始于基础架构的突破。2017年Transformer架构的提出,通过自注意力机制(Self-Attention)解决了传统RNN的序列依赖问题,使模型能够并行处理……