一、Transformer架构基础:从NLP到CV的范式迁移 Transformer架构最初由Vaswani等人提出,其核心是通过自注意力机制(Self-Attention)实现序列数据的全局建模。在NLP领域,标准Transformer采用多头注意力、位置编……