一、ViT的诞生背景:从NLP到CV的范式迁移 计算机视觉领域长期由卷积神经网络(CNN)主导,其局部感受野与平移不变性设计在图像分类、目标检测等任务中表现优异。然而,CNN的架构存在两个核心局限:一是依赖手工设……