一、大模型推理的技术演进与核心论文脉络 大模型推理的技术发展可划分为三个阶段:基础架构探索期(2018-2020)、效率优化突破期(2021-2022)和工程化落地期(2023至今)。早期研究聚焦于Transformer架构的推理可……