一、多智能体强化学习技术演进背景 多智能体系统(MAS)通过多个独立智能体协作完成复杂任务,已成为自动驾驶、工业机器人集群等场景的核心技术。相较于单智能体强化学习(RL),MARL需解决三个核心挑战:非平稳环……