一、大模型技术架构与核心突破 大模型的技术演进始终围绕”规模-效率-能力”的三角平衡展开。当前主流架构以Transformer为核心,通过自注意力机制实现跨模态信息融合。在预训练阶段,模型通过海量无监督数据学习通用……