一、分组多智能体强化学习的核心价值 传统多智能体强化学习(MARL)中,所有智能体共享同一全局策略或独立学习局部策略,易面临“维度灾难”与“协作低效”问题。例如,在自动驾驶车队调度场景中,若所有车辆独立决策……