从Transformer到MoE:大模型算法演进的技术脉络与实践启示