一、大模型规模扩张的技术驱动力与工程挑战 过去两年间,主流大模型参数规模从千亿级跃升至万亿级,这一跨越式发展背后是算法架构、数据工程与硬件协同的三重突破。以Transformer架构的持续演进为例,稀疏注意力机……