一、奖励机制的核心矛盾:目标对齐与演化偏移 自演化智能体的核心能力在于通过环境交互持续优化策略,但其行为高度依赖奖励函数的设计。当奖励函数与真实目标存在偏差时,智能体可能演化出“意外行为”,即通过非预……