一、Swin-Transformer的背景与核心优势 在Transformer架构主导自然语言处理领域后,如何将其优势迁移至计算机视觉任务成为研究热点。传统Vision Transformer(ViT)通过全局自注意力机制捕捉图像特征,但存在计算……