一、大模型评估的理论基础 大模型评估的本质是通过量化指标反映模型能力边界,其理论支撑涵盖多学科交叉领域,核心包括以下三方面: 1. 信息论视角:信息压缩与表达能力 大模型可视为对训练数据的压缩编码,其评估……