一、LLM技术架构与核心组件 1.1 模型基础结构 LLM的核心架构基于Transformer网络,通过自注意力机制实现长距离依赖建模。典型结构包含编码器-解码器(如T5)或纯解码器(如GPT系列)两种模式,其中解码器架构因生……