一、Swin-Transformer的技术定位与核心问题 传统Transformer架构在自然语言处理领域取得了巨大成功,但直接应用于视觉任务时面临两大挑战:其一,图像数据的高分辨率导致全局自注意力计算复杂度呈平方级增长(O(N²……