一、大模型技术分类与核心原理 1.1 模型架构分类 大模型按架构可分为Transformer家族、混合架构模型和专用领域模型。Transformer架构(如GPT、BERT)通过自注意力机制实现并行计算,突破了RNN的序列依赖限制,成为……