一、Vision Transformer的技术背景与核心优势 计算机视觉领域长期由卷积神经网络(CNN)主导,但CNN存在两大局限:局部感受野限制了全局信息建模能力,且参数规模随深度增加呈指数级增长。2020年Google提出的Visio……