一、人工智能迷惑行为的定义与典型表现 人工智能的”迷惑行为”指模型在特定场景下输出与人类预期严重偏离的结果,例如图像识别模型将猫误判为鳄梨酱、对话系统生成逻辑断裂的回答、自动驾驶系统在简单路况下做出危……