一、大模型技术基石:Transformer架构深度解析 生成式大模型的核心突破源于Transformer架构,其自注意力机制(Self-Attention)彻底改变了序列处理的范式。相比传统RNN的时序依赖,Transformer通过并行计算实现全……