一、Transformer架构的起源与设计动机 Transformer架构由Vaswani等人在2017年提出,其核心目标在于解决传统RNN/LSTM模型在长序列处理中的两大痛点:并行化困难与长距离依赖捕捉不足。传统序列模型需按时间步依次计……