一、大模型技术架构演进与核心突破 1.1 模型架构的范式革新 Transformer架构自2017年提出后,通过自注意力机制(Self-Attention)彻底改变了序列建模方式。其核心优势在于并行计算能力与长距离依赖捕捉能力,例如G……