Swin-Transformer:移动窗口与层级结构的视觉新范式 一、视觉Transformer的演进与核心挑战 自视觉Transformer(ViT)提出以来,其通过自注意力机制直接建模图像全局依赖的能力,在图像分类、目标检测等任务中展现……