一、Transformer网络的核心架构与历史背景 Transformer网络由Vaswani等人在2017年提出,其核心设计目标是解决传统RNN/LSTM在处理长序列时的梯度消失与并行计算效率低下问题。与循环结构不同,Transformer采用完全……