一、Transformer的技术演进与ViT的诞生背景 Transformer架构最初因其在自然语言处理(NLP)领域的突破性表现而闻名,其自注意力机制(Self-Attention)通过动态捕捉序列中元素间的全局依赖关系,显著提升了长文本……