一、Transformer架构的诞生背景与核心优势 Transformer架构最早由Vaswani等人在2017年提出,其核心目标是解决传统循环神经网络(RNN)在处理长序列时的梯度消失与并行化困难问题。相较于RNN和卷积神经网络(CNN)……