一、视觉Transformer技术发展背景 自2020年Google提出Vision Transformer(ViT)以来,计算机视觉领域经历了从CNN主导到Transformer融合的范式转变。传统CNN架构受限于局部感受野和固定归纳偏置,在处理长距离依赖……