引言:Transformer的统治与隐忧 自2017年《Attention is All You Need》论文提出Transformer架构以来,其凭借自注意力机制(Self-Attention)与并行计算能力,迅速成为自然语言处理(NLP)、计算机视觉(CV)甚至……