一、位置编码的范式转移:从绝对到旋转的突破 传统Transformer架构依赖绝对位置编码(Absolute Position Embedding)处理序列顺序,但该方案在长文本场景下存在两大缺陷:其一,固定位置向量无法适应训练时未见过……