一、Transformer架构的演进背景与核心优势 在深度学习发展历程中,循环神经网络(RNN)及其变体(LSTM、GRU)长期占据序列建模的主导地位。然而,RNN类模型存在两大根本性缺陷:其一,序列依赖导致无法并行计算,……