一、大模型评测的技术挑战与OpenCompass的定位 在人工智能技术快速迭代的背景下,大模型评测面临三大核心挑战:评测标准碎片化(不同场景下指标定义差异大)、计算资源消耗高(单次评测需调用数千次模型API)、结……