一、技术背景与核心价值 Swin Transformer作为基于Transformer架构的视觉模型,通过分层窗口注意力机制实现了高效的特征提取,在实例分割任务中展现出显著优势。其核心价值在于: 多尺度特征融合:通过分层设计捕……