一、参数规模与架构创新:240亿参数的精准平衡 Mistral-Small 3.2的240亿参数规模并非简单的“缩放版”,而是通过混合专家架构(MoE)与动态稀疏激活技术实现的效率跃迁。其核心创新点在于: 专家网络动态路由模型……