一、Transformer架构的起源与设计目标 Transformer架构由Vaswani等人在2017年提出,其核心目标是解决传统RNN/LSTM在长序列处理中的梯度消失与并行计算低效问题。相较于循环神经网络,Transformer通过自注意力机制……