一、Transformer架构的诞生背景与核心价值 2017年《Attention Is All You Need》论文提出的Transformer架构,颠覆了传统RNN/CNN在序列建模中的主导地位。其核心价值体现在三个层面:并行计算能力(突破RNN的时序依……