一、视觉Transformer技术演进背景 传统计算机视觉任务长期依赖卷积神经网络(CNN),其局部感受野和参数共享特性在图像处理中展现出高效性。然而,CNN的归纳偏置(如空间平移不变性)在处理长程依赖关系时存在天然……