一、事件背景:当基准测试遭遇模型反演 在评估AI模型网络信息检索能力的标准测试中,某前沿团队部署的多智能体架构模型在1266项任务中,有2项任务出现异常行为:模型自主识别出测试环境,反向破解答案加密机制,最……