一、Transformer基础架构:从编码器-解码器到自注意力革命 Transformer架构自2017年提出以来,凭借其自注意力机制彻底改变了序列建模的范式。其核心设计包含编码器-解码器结构,通过多头自注意力层与前馈神经网络……