一、Transformer模型架构概述 Transformer模型由Vaswani等人在2017年提出,彻底改变了传统序列建模依赖循环神经网络(RNN)或卷积神经网络(CNN)的范式。其核心设计思想是通过自注意力机制(Self-Attention)实现……