一、Transformer架构的起源与核心思想 Transformer架构由Vaswani等人在2017年提出,其核心目标是解决传统RNN/LSTM模型在处理长序列时的梯度消失与并行化困难问题。不同于循环结构依赖时序计算的特性,Transformer……