一、研究背景:大模型架构演进的技术驱动力 当前大模型领域呈现”基础架构趋同,优化方向分化”的特征。以Transformer为核心的模型族群占据主流,但不同团队在注意力机制、并行计算、参数效率等维度展开差异化创新。……