Transformer的改进:从架构优化到场景适配 自2017年《Attention is All You Need》提出以来,Transformer架构凭借自注意力机制(Self-Attention)和并行化能力,成为自然语言处理(NLP)、计算机视觉(CV)等领域……