一、AI视觉评估的困境与破局需求 当前主流视觉评估体系存在三大核心缺陷:其一,测试数据集高度结构化,难以反映真实场景的模糊性与不确定性;其二,任务设计局限于单一模态,无法验证多模态交互能力;其三,评估……