一、大模型的技术分类体系 1.1 按技术架构分类 Transformer架构模型以自注意力机制为核心,通过多头注意力层捕捉序列中的长距离依赖关系。典型代表包括基于原始Transformer的编码器-解码器结构(如T5),以及仅编……