一、技术架构:MoE设计的轻量化突破 DeepSeek-V2-Lite的核心创新在于其混合专家模型(Mixture of Experts, MoE)的轻量化实现。传统MoE模型通过动态路由机制激活部分专家网络,但往往因专家数量过多导致计算冗余。……