Pyramid Vision Transformer:Vision Transformer的多尺度进化 自Vision Transformer(ViT)提出以来,基于自注意力机制的视觉模型在图像分类任务中展现出强大能力。然而,传统ViT结构采用全局注意力计算,存在计……