一、Transformer的数学抽象:从序列到图的映射 Transformer的核心突破在于将序列处理问题转化为带权有向完全图的加权求和问题。传统RNN/LSTM通过时序递归传递状态,本质是线性链式依赖;而Transformer通过自注意力……