图像Transformer双雄:ViT与Swin架构深度解析 一、视觉Transformer的崛起背景 传统计算机视觉任务长期依赖卷积神经网络(CNN),其局部感受野和权重共享特性在图像分类、检测等任务中表现优异。但随着Transformer……