一、技术演进背景:从NLP到CV的范式迁移 传统计算机视觉(CV)领域长期依赖卷积神经网络(CNN),通过局部感受野和权重共享机制提取空间特征。然而,CNN存在两大局限性:一是固定尺寸的卷积核难以捕捉长程依赖关系……