引言:视觉Transformer的突破与挑战 自Vision Transformer(ViT)将自然语言处理中的Transformer架构引入计算机视觉领域以来,视觉模型的设计范式发生了根本性变革。ViT通过将图像分块为序列化的patch嵌入,利用全……