一、评估体系构建的三大核心维度 AI Agent的评估需覆盖功能正确性、决策透明度与自主进化能力三大核心指标。当前主流评估框架可分为三类:基于标准答案的确定性评估、过程可解释的程序性分析、以及模拟真实场景的……