一、智能体评估的范式困境与破局之道 在通用人工智能(AGI)发展浪潮中,智能体(Agent)作为核心载体,其能力评估始终面临三大挑战:评估维度碎片化导致不同研究难以横向对比,任务场景单一化无法反映真实复杂环……