一、Transformer架构的起源与核心思想 Transformer架构诞生于2017年谷歌的论文《Attention Is All You Need》,其核心思想是通过自注意力机制(Self-Attention)替代传统的循环神经网络(RNN)或卷积神经网络(CNN……