一、大模型架构的范式革新 当前大模型技术正从单一Transformer架构向混合架构演进。例如,注意力机制与状态空间模型(SSM)的融合成为新趋势。SSM通过状态空间表达实现线性复杂度的长序列建模,在处理超长文本(如……