一、架构创新:从标准结构到轻量化设计 视觉Transformer(ViT)自2020年提出以来,其标准架构(将图像分块后嵌入为序列,通过多头自注意力机制建模全局关系)已成为基础范式。但标准ViT存在计算复杂度高、局部信息……