一、分层窗口机制:突破计算效率瓶颈 传统Vision Transformer(ViT)采用全局自注意力计算,导致二次复杂度(O(N²))的算力消耗,难以处理高分辨率图像。Swin Transformer通过分层窗口自注意力(Shifted Window Mu……