一、模型架构与基础概念 1.1 Transformer架构核心组件 Transformer作为大模型的基础架构,其核心组件包括: 自注意力机制(Self-Attention):通过Q(Query)、K(Key)、V(Value)矩阵计算输入序列中各位置的关……