一、ViT模型:Transformer的视觉革命起点 1.1 模型诞生的技术背景 传统计算机视觉任务长期依赖卷积神经网络(CNN),其局部感受野与平移不变性设计虽在图像分类中表现优异,但存在全局信息建模能力不足、长距离依……