一、科学通用智能评测的范式革新 在人工智能技术迈向通用化的进程中,科学计算领域始终存在评估标准缺失的痛点。传统基准测试多聚焦于语言理解或视觉识别等单一模态,难以全面衡量模型在真实科研场景中的综合能力……