一、Transformer大模型的前世今生:从概念到技术革命 1.1 起源:从RNN到注意力机制的突破 Transformer大模型的技术根基可追溯至2017年Google发表的《Attention Is All You Need》论文。在此之前,序列建模的主流方……