一、基础概念:大模型技术栈的核心构成 1.1 Transformer架构深度解析 Transformer作为大模型的核心架构,其自注意力机制(Self-Attention)是面试高频考点。需重点理解: QKV矩阵运算:输入序列通过线性变换生成……