一、背景:Transformer架构的演进与瓶颈 自2017年Transformer架构提出以来,其基于自注意力机制的设计彻底改变了自然语言处理(NLP)领域,成为BERT、GPT等主流模型的核心。然而,随着应用场景的扩展,传统Transfo……