一、Transformer:从NLP到跨模态的范式革命 Transformer架构起源于自然语言处理领域,其核心创新在于自注意力机制(Self-Attention)。与传统循环神经网络(RNN)或卷积神经网络(CNN)的序列/局部处理模式不同,T……