一、Transformer的诞生背景与核心优势 在自然语言处理(NLP)领域,传统的循环神经网络(RNN)和卷积神经网络(CNN)长期占据主导地位。然而,RNN的序列依赖性导致训练效率低下,CNN的局部感受野限制了长距离依赖……