一、Transformer架构的起源与核心思想 Transformer架构由Vaswani等人在2017年提出,彻底改变了自然语言处理(NLP)领域的技术范式。其核心思想是通过自注意力机制(Self-Attention)替代传统的循环神经网络(RNN)……