一、Transformer架构技术演进与模型分类 Transformer架构自2017年提出以来,通过自注意力机制(Self-Attention)和并行计算优势,迅速成为自然语言处理(NLP)领域的基石。当前主流大模型可划分为三大技术流派: 1……