一、技术架构:从单一模型到混合智能体 2025年,大语言模型的核心架构已突破传统Transformer框架的局限,形成以混合专家系统(MoE)和动态注意力机制为主导的新范式。主流模型通过模块化设计实现参数效率与推理速……