一、技术选型:平衡性能与成本的决策框架 1.1 模型架构选择 当前主流大模型架构可分为三类:Transformer解码器(如GPT系列)、编码器-解码器混合架构(如T5)、以及专为长文本设计的稀疏注意力模型(如Longformer……