一、Transformer为何成为CV领域新宠? 自2020年《An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale》论文发表以来,Vision Transformer(VIT)彻底改变了计算机视觉领域的技术范式。……