一、独立多智能体强化学习的核心挑战 独立多智能体强化学习(I-MARL)中,每个智能体独立学习策略,仅依赖局部观测与奖励信号,无需全局通信或协调机制。这种设计虽降低了系统复杂度,但面临两大核心挑战: 非平……